最新のRAGシステムAIを開発した株式会社Archaicの取り組み
株式会社Archaicは、日本語特化型のRAG(Retrieval-Augmented Generation)システムAIを開発したことを発表しました。このシステムは、業務で使用される文書が抱える複雑さに対応し、特に図表や画像が多く含まれる複合的な文書構造を理解する能力を持っています。評価に用いたのは、第三者が公開する日本語ベンチマーク形式の評価データセットで、製造業カテゴリにおいてはトップクラスの成績を収めました。これにより、業務活用の場面で高精度かつ実用的な結果を提供しています。
Archaic RAGシステムAIの特長
Archaic RAGシステムAIは、業務文書がテキストだけでなく、図や表、画像をも包含するという現代的なニーズに応えるために開発されました。従来のAIでは、このような複雑な情報が意図する通りに処理されないことが多く、間違った回答や情報の取りこぼしが発生していました。しかし、Archaicでは文書の構造を深く理解し、情報の関連性を保持する工程を設けました。
このシステムの核を成すのは、以下のふたつの独自技術です:
1.
Parser(文書解析エンジン)
文書から必要な要素を自動で抽出し、内容に応じた単位で分解します。これにより、AIが適切に理解できる形式に変換され、これまでのRAGでは対応が難しかった非構造文書でも効果的に扱うことが可能となります。
2.
Tree-Data構造(情報階層化技術)
抽出された情報は、文脈や関連性を基にして階層構造に整理されます。この仕組みにより、本文と図、注釈などの関係性を適切に維持した出力が可能となり、正確で意味のある回答を提供します。
一般的なRAGとの違い
通常のRAGは、テキストに特化し、図や表が含まれた複雑な構造を扱う際には情報が欠如してしまいがちでした。これに対し、ArchaicのRAGは図や表、画像を含む複合文書を一貫して処理する能力があります。その結果、応答の正確性や網羅性が大幅に向上しました。
性能評価の実施
Archaicは、日本語RAG評価データセットを活用し、定量的にその性能を評価しました。このベンチマークは、金融、情報通信、製造、公共、流通・小売の5業種における業務想定のQ&Aペアから構成され、生成結果の正答率によって性能を評価しました。使用した大規模言語モデルはClaude 3.5 Sonnetが一貫して採用され、精度の違いが明確になりました。
業種別評価結果
各業種における正答率は以下の通りです:
- - 金融:83.3%(50/60)
- - 情報通信:85.0%(51/60)
- - 製造:91.7%(55/60) ※最高評価
- - 公共:93.3%(56/60)
- - 流通・小売:93.3%(56/60)
全体平均では89.3%(268/300)という高い正答率を記録し、Archaic RAGシステムAIの性能の高さを証明しています。
開発者のコメントと今後の展望
株式会社ArchaicのCTO、Zhaoxu Wang氏は「RAGは言葉の検索と生成を超え、今後は構造理解も必要不可欠になる」と述べています。新しいRAGには、構造を理解し、意味をつなぐ力が鍵となると考えており、今後は業種別の最適化テンプレートの開発、非構造文書向けのAIサービス提供に向けて取り組みを進めていくとしています。
また、AIの活用により、日本国内での業界全体の底上げが図られることを期待し、より多くの企業がこのシステムを導入することを目指しています。
企業情報
株式会社Archaicは、2017年に設立され、東京都渋谷区に本社を置く企業です。AI技術の受託開発や研究開発を手がける専門集団であり、各業種向けにカスタムAIを提供しています。同社は次世代RAGシステムAIを通じて、業務の効率化や知識活用の向上を目指しています。詳細については
公式ウェブサイトをご覧ください。