FastLabelが新たなLLM開発をサポート
FastLabel株式会社は、ストックマーク株式会社へ日本語特化型LLM(大規模言語モデル)開発のための独自データを作成し、提供することに成功しました。両社の連携は、経済産業省とNEDOが推進する生成AI開発プロジェクト“GENIAC”の一環として行われ、特に日本語における高品質なデータの重要性が浮き彫りになっています。
日本のLLM開発の現状
日本におけるLLM開発は、さまざまな課題に直面しています。特に注目されるのがデータの質と量です。英語圏と比べて高品質な公開データセットが不足しており、また日本語独特の表記の揺れや曖昧さがモデルの学習を困難にしています。さらに、日本国内ではAIエンジニアや研究者の数も限られており、専門的な知識と経験を持つ人材が不足しているのが現状です。
FastLabelの支援内容
FastLabelは、データの収集からアノテーションまでを一貫してサポートしました。ストックマークが求める数万枚のパワーポイントデータをテキストデータへ変換し、その中に含まれる図版やグラフの意味を伝えるための作業を行いました。この支援により、ストックマークのLLM開発が円滑に進みました。ストックマークのSenior Researcher梨長さんは、FastLabelが提供したアノテーションについて、「モデルが学習しやすい形に変換してもらったことで、開発がスムーズに進行した」と語っています。
今後の展望
本プロジェクトが進むことで、生成AI開発における日本語特有の課題を解決するための道筋が見えてきました。GENIACプロジェクトの第2期が2024年10月に発表される予定ですが、その前にFastLabelはさらなるデータの提供と支援を重ねます。
また、当社は「データセット提供」、「アノテーション代行」、「モデル開発支援」などのトータルソリューションを提供し、AI開発を行う企業をサポートしています。特に権利クリアかつ高品質なデータの作成に注力しており、豊富な経験に基づいた支援を通じて、多くの企業の成長を目指しています。
セミナーのご案内
さらに、2025年6月4日には、GENIAC採択プロジェクトに関するウェビナーを開催します。参加者は、ストックマーク株式会社、NABLAS株式会社、FastLabel株式会社の研究テーマや成果、課題への具体的なアプローチについて学ぶことができます。興味のある方は是非ご参加ください。
ウェビナー詳細・申し込みはこちら
まとめ
FastLabelの今回の支援は、日本におけるAI開発の進展に向けた重要な一歩です。ストックマーク社との協力関係を深め、さらに多くの企業が日本語LLMの開発に取り組める環境を整えていくことで、生成AI技術の向上を期待しています。引き続き、FastLabelは企業のニーズに応え、最適なソリューションを提供していきます。