新サービス「1extract」
2024-07-26 08:26:26

PDFデータ抽出を高精度で実現する新サービス「1extract」登場

株式会社Feynma Technologyが新たに開発したPDF抽出サービス「1extract」は、AIや機械学習を活用したテキストデータの正確な抽出を実現します。

このサービスは、特にPDF文書からのテキストデータ読み込みの需要が高まる中で、正しく情報を抽出できないとの声を反映して誕生しました。実際に、顧客からは「PDFから正確にテキストが読み込めない」「画像入りのPDFではテキストが混在して抽出される」といった課題が寄せられていました。これを受けて、Feynma Technologyは、2021年に開発した論文翻訳AI「1paper」を基に、より高精度なPDF抽出エンジンを開発しました。

「1extract」の特徴


「1extract」を利用することで実現できる利点は、多岐にわたります。まず、PDFファイルから文字情報を正確に抽出できることです。特に、文字情報が埋め込まれていないスキャン画像でもOCR処理なしで情報を取り出せる点が特筆されます。また、特殊なPDFファイルに対しても適応性を持ち、改行やページ区切りを意識しながら自然な文に整形することが可能です。

さらに、必要に応じて図や式を画像のまま保持することもでき、テキストデータに影響を及ぼしません。これにより、業務効率が飛躍的に向上することが期待されています。

利用シーンの紹介


この新しいサービスは、さまざまな業界での活用が期待されています。例えば、社内文書に基づく質問応答を行うAIチャットシステムにおいて、正確なテキストデータを使用することで回答の精度が改善されます。この点に関しては、顧客からも高評価を得ており、情報抽出結果を活用することで、質の高い回答を提供できるようになっているとのこと。

また、技術文書を用いた新たな業務プロセス構築にも最適です。専門的な情報を効率よく処理するための基盤として、「1extract」が役立つことが広がります。特に、医学や生命科学、物理学、化学などの研究分野に於いては、正確なデータをもとにAIを活用した新しい知識の探索が進んでいます。

加えて、国産の大規模言語モデル(LLM)開発にも寄与しそうです。従来のウェブデータだけでは補いきれない分野特化型データが、PDFの形式で数多く残されているため、このサービスが多くの研究者にとって価値あるツールとなるでしょう。

会社の概要


株式会社Feynma Technologyは、「テクノロジーで働くヒトを助ける」というミッションのもと、AIやディープラーニングを活用したさまざまなサービスを展開しています。研究支援やDXコンサルティング等も手がけ、多岐にわたるニーズに応える企業でもあります。これまでのチームの経験や技術をもとに、今後もニーズに合ったサービス展開を行っていく計画です。

最新情報やサービスに関心がある方は、公式ウェブサイトを訪れてみてください。


画像1

画像2

画像3

画像4

会社情報

会社名
株式会社Feynma Technology
住所
愛知県名古屋市東区東桜1-1-1 アーバンネット名古屋 ネクスタビル内 LIFORK久屋大通
電話番号

トピックス(IT)

【記事の利用について】

タイトルと記事文章は、記事のあるページにリンクを張っていただければ、無料で利用できます。
※画像は、利用できませんのでご注意ください。

【リンクついて】

リンクフリーです。