生成AIによる化学文書解析の革新
近年、生成AIの進化により、さまざまな分野での文書解析や情報抽出が自動化されつつありますが、化学の領域には独自の課題があります。特に、化学構造式の処理においては、一般的な生成AIが持っていない特化した技術が求められます。そんな中、株式会社ピクシストは、化学分野における生成AIの新たな利用法を発見しました。
新しい手法の背景
従来の生成AIシステムは、テキストの理解には優れていますが、化学構造式のような専門的な視覚情報を扱うのには限界がありました。特に、PDF内に埋め込まれた化学構造式の正確な解釈は難しく、複雑な構造式ではハルシネーション(画像解析による錯覚)を引き起こすことがありました。さらに、化学構造式を認識するための深層学習ツールは精度が高いものの、文書全体の文脈を理解する能力には欠けていました。
新しい手法の概要
ピクシストによる新手法では、化学構造式を抽出・構造化する深層学習ツールと、生成AIの文脈理解力を組み合わせます。この手法により、化学文書の解析が飛躍的に向上します。
1.
構造式の抽出
最初に、化学文献から構造式を自動的に検出し、抽出する深層学習ツールを使用します。これにより、PDF内に存在する構造式を個別の画像として取り出すことができます。
2.
OCRによるデータ変換
次に、抽出した構造式画像を機械可読な形式に変換します。この段階では、MOL形式やSMILES表記への変換が行われ、化学構造の詳細情報をJSONファイルとして出力します。
3.
生成AIへの入力
最後に、元のPDFファイルと生成されたJSONファイルの両方を生成AIに取り込み、高度な化学文献解析を行うことが可能となります。例えば、PDF内の化学構造式とその解説文を相互に参照し、整合性を確認することができます。
この新技術により、化学文献の分析がより正確かつ効率的になることが期待されています。構造式の間の関係性や文書全体の流れも保持されるため、文献の理解が一層容易になります。さらに、全ての構造式を一つのJSONファイルにまとめることで、生成AIが参照しやすくなります。
オープンソースツールの提供
この新手法を実現するために、株式会社ピクシストは以下の2つのオープンソースツールを無償で提供します。
機能: PDFから化学構造式を抽出し、Base64 JSON形式で出力。
URL:
ChemGrasp-Segmentation
機能: Base64データを画像に変換し、MOL形式で出力。
URL:
ChemGrasp-OCSR
このようにして、医療や化学分野におけるAIとIoTの活用が進む中で、株式会社ピクシストは今後も技術革新を続け、特許や文献を生成AIによって分析するための有効な手法を提供していく意向です。
会社概要
株式会社ピクシストは、茨城県土浦市に本社を置き、2020年に設立され、医療業界へのAI技術の適用を推進する企業です。代表の関根章博氏が率いる同社は、システム開発や知的財産のコンサルティングを通じて、今後の医療を支える存在となることを目指しています。