リコーが無償公開するマルチモーダルLLMとは
株式会社リコー(社長執行役員:大山 晃)は、経済産業省とNEDOが進める国内生成AI強化プロジェクト「GENIAC」の一環として、画期的なマルチモーダル大規模言語モデル(LMM)の基本モデルとその評価環境を無償で公開しました。この発表は、2025年4月24日から始まる新たなAI技術の活用に向けた大きな一歩となります。
この基本モデルは、日本語の文書を図表とともに研究し、視覚情報とテキスト情報の両方を統合した質問応答が可能です。その結果、リコーの開発したマルチモーダルLLMは、他のモデルと比較しても優れた性能を示すことが明らかになっています。特に、7月29日に開催される画像の認識・理解に関するシンポジウム「MIRU2025」で、この技術に基づいた論文が発表されることから、注目が集まっています。
GENIACプロジェクトの意義
リコーは、GENIACの第2期で開発したこのLMMを、今後もさらに進化させる計画です。第3期においては、企業内のドキュメントを多段階に解析することで、より高精度な読み取りを目指します。これは、企業が保有する知識を最大限に活用し、業務の革新や効率化を図ることに貢献します。
利用方法とベンチマーク
リコーのマルチモーダルLLMは、以下のリンクからアクセス可能です。
無償公開の詳細
また、モデルの性能を検証するための独自のベンチマークツールも提供されており、他のモデルとの比較結果が見られます。これにより、自社のAI導入を検討する企業は、実際の性能を把握した上で判断できます。
リコーのAI開発の歴史
リコーは1980年代からAIの研究を開始し、2015年以降は深層学習技術を活用したAIの発展に注力しています。製造業向けの应用も進めてきたリコーは、2021年からは自然言語処理にも乗り出し、顧客の声をデータ分析することで顧客サービスの向上を図っています。さらには、2022年からは大規模言語モデル(LLM)の開発にも着手し、2023年3月には独自のLLMを発表。これにより、700億パラメータに達する大規模なモデルも実現し、様々な言語に対応するAIの基盤開発にも取り組んでいます。
リコーの今後の展望としては、画像認識や自然言語処理に加え、音声認識AIの研究も進行中です。音声対話機能を持つAIエージェントの提供も始めており、対話形式での情報提供・サポートが可能です。
さらに広がるリコーの取り組み
リコーは、経済産業省が推進する国内生成AI開発力強化プロジェクト「GENIAC」にこれまで以上に力を入れており、様々な企業と共同開発を進めています。最近では、損保ジャパンとの共同プロジェクトも発表され、マルチモーダルLLMのさらなる発展が期待されています。
このように、リコーは技術の進化を通じて、効率的かつ革新的なビジネスの実現をサポートし続けます。その活動の最前線には、常に最新のAI技術が存在しており、各企業の経営に新たな風を吹き込む存在として、今後も注目されることでしょう。今後の展開に、ますます目が離せません。