マルチモーダルLLMでRAGの精度向上を実現
ストックマーク株式会社は、東京都港区に本社を置く企業で、最新のデータ構造化プラットフォーム「Stockmark A Technology(SAT)」にRAG(Retrieval-Augmented Generation)システムの検証機能を追加しました。この新機能によって、企業は自社の持つさまざまな形式のデータを高精度で構造化し、そのデータを基にRAGシステムを検証することが可能になります。これにより、組織全体でのRAGシステムの構築と改善が加速されることが期待されています。
SATの概要
「SAT」は、生成AIを最大限に活用し、特にRAGシステムの精度を高めるための重要なサービスです。このプラットフォームは、マルチモーダルLLMを活用して、テキスト、図、表など、複雑なビジネスデータを正確に構造化することができます。構造化されたデータを基にナレッジグラフを自動生成することで、あらゆる関連情報を迅速に検索し、正確な回答を導くことが可能になります。これによりデータの関連性を正しく把握でき、RAGシステムの開発にも大きく寄与します。
SATの特徴
1.
複雑なデータの容易な構造化
SATの最大の特徴の一つは、各種形式の複雑なビジネスデータを簡単に構造化できることです。特に図や表を含む多様なドキュメントを、短時間でテキストデータに変換し、検索可能な形式にします。
2.
ナレッジグラフの自動生成
構造化されたデータベースからは、概念同士の関係性を理解したナレッジグラフが自動で生成されます。これにより、専門的な知識を持つ組織内でも対象情報の検索と回答生成が可能となります。
3.
RAGシステムの検証と改善の実現
SATでは、構造化されたデータと自動生成されたナレッジグラフに基づき、質問と回答の検証が行えます。これにより、RAGシステムの構築が加速し、増加するドキュメントにも柔軟に対応できるのです。
今後の開発計画
ストックマーク株式会社は、「SAT」を通じて生成AIの活用を一手に支援するプラットフォームへと進化する計画です。今後はデータ構造化からRAGシステムの構築、検証、改善までを一元管理できる機能が追加される予定です。また、APIを通じてSATに接続することで、組織内のRAGシステムとの連携を図り、さらなる改善サイクルの実現を目指します。
数据構造化の重要性
生成AIの導入において、2016年以来、約70%の企業が何らかの形で生成AIを取り入れていますが、実際の利用は限定的です。特に、約35%の企業が数日に一度の利用頻度と報告しています。その一因として、生成AIの「ハルシネーション」と称される誤りが挙げられます。RAGシステムは、この問題を克服する手段として位置づけられ、特に非定型のドキュメントを構造化することが求められます。
無料オンラインセミナーの開催
この度、SATの新機能を記念し、無料オンラインセミナーを2023年12月5日(木)に実施します。セミナーでは、RAG精度向上のポイントに関する具体的な情報やデモンストレーションを行いますので、ぜひご参加ください。
企業情報
ストックマーク株式会社は、「価値創造の仕組みを再発明し、人類を前進させる」というミッションのもと、生成AI技術を活用して企業変革を支援しています。社内外の情報検索を一元化する「Anews」や、データ構造化を実現する「SAT」を通じて、企業の成長に寄与しています。詳細な情報は公式ウェブサイトにてご覧ください。(
ストックマーク株式会社公式サイト)