理研LLMデータでAI開発加速
2024-06-26 13:28:42
ファーストアカウンティング、理化学研究所のLLMインストラクションデータライセンス取得でAI開発加速
ファーストアカウンティング株式会社は、理化学研究所が提供する日本語の大規模言語モデル(LLM)インストラクションデータの商用ライセンスを取得したと発表した。
理化学研究所が立ち上げた「LLMのための日本語インストラクションデータ作成プロジェクト」は、日本語LLMの学習データ不足という課題を克服するため、企業との共同研究を通じてインストラクションデータを集めた。ファーストアカウンティングは、このプロジェクトに参画し、LLM用トレーニングデータの評価、分析、フィードバックなどを担ってきた。
今回取得したライセンスにより、同社は自社のAI開発においても理研LLMデータを利用できるようになった。同社は、NVIDIA DGX H100を導入し、AI研究開発に注力している。理研LLMデータの活用により、ChatGPTや他社のモデルに依存せず、自社でゼロからLLMを構築できる環境が整い、研究開発が加速すると期待される。
ファーストアカウンティングは、現在、画像情報も扱うマルチモーダルな基盤モデルの開発を進めている。このモデルは、画像を元にLLMが指示を受け、従来よりも柔軟な処理が可能になる。同社は、この機能を証憑画像からの摘要生成、OCR、項目抽出、勘定科目の予測などに活用し、会計業務や税務特化の自社プロダクトに組み込む予定だ。
ファーストアカウンティングの代表取締役社長である森啓太郎氏は、今回のライセンス取得について、「生成AI分野の研究開発は、他社との差別化をはかるためにも非常に重要な成長戦略のひとつです。今回、理研さんのインストラクションデータのライセンスを取得したことにより、より一層技術力に磨きをかけて、お客様にとってさらに役立つサービスのご提供に繋げられるよう尽力してまいります。」とコメントしている。
ファーストアカウンティングが理化学研究所のLLMインストラクションデータライセンスを取得したことは、同社のAI開発戦略において大きな転換点となるだろう。
従来、日本語LLMの開発においては、学習データの不足が課題となっていた。しかし、理研LLMデータの活用により、ファーストアカウンティングは、質の高い日本語データを用いて、より高精度なLLMを構築できるようになる。
特に、画像情報も扱うマルチモーダルな基盤モデルの開発は、会計業務の自動化・効率化に大きな可能性を秘めている。証憑画像からの摘要生成、OCR、項目抽出、勘定科目の予測など、従来は人手に頼っていた業務を自動化できるようになることで、業務効率の大幅な改善が期待される。
さらに、ファーストアカウンティングは、自社でゼロからLLMを構築することで、他社のモデルに依存しない独自性の高いサービスを提供できるようになる。これは、同社にとって競争優位性を確立するための重要な要素となる。
今回のライセンス取得は、ファーストアカウンティングが生成AI分野においてリーダーシップを発揮していくための重要な一歩となるだろう。同社の今後の動向に注目したい。