rinna株式会社が新たに公開したGemma 2 Baku 2Bシリーズ
rinna株式会社は、東京都渋谷区に拠点を構え、AI技術を駆使したさまざまなソリューションを提供している企業です。同社は、日本語に特化した大規模言語モデル(LLM)の新シリーズ「Gemma 2 Baku 2B」を発表しました。このモデルは、Googleが提供するGemma 2 2Bを基に、日本語向けの継続事前学習と指示学習が施されたものです。
Gemma 2 Baku 2Bシリーズの特長
「Gemma 2 Baku 2B」シリーズは、日本語と英語のデータを用いて800億トークンの学習を行っており、リソースの限られた環境でも高いテキスト生成が可能です。このモデルの最大の特徴は、26億パラメータという軽量な設計にあります。これにより、特定の利用目的に応じて効率的に学習が行えるだけでなく、コストパフォーマンスが優れているため、高性能なGPUを備えないデバイスでも利用可能です。
さらに、指示学習を施した「Gemma 2 Baku 2B Instruct」は、人間との対話をより自然に行えるように設計されています。このモデルは、rinnaの提供するHugging Faceのプラットフォーム上で、誰でも簡単に試すことができます。これにより、開発者や研究者はよりリアルな対話体験を得ることができ、新たな応用範囲が広がります。
ベンチマーク結果
Gemma 2 Baku 2Bシリーズの性能は、Japanese MT-BenchとJapanese LM Evaluation Harnessでのベンチマーク結果からも明らかです。これらのテストでは、この新モデルがオリジナルのGemma 2 2Bシリーズよりも日本語処理能力において優れていることが示されています。特筆すべきは、26億パラメータの「Gemma 2 Baku 2B Instruct」が、80億パラメータを誇るLlama 3 Youko 8B Instructよりも高得点を獲得した点です。
今後の展望
AIテクノロジーが進化を遂げる中で、利用目的に応じたモデルの開発と運用が急務となっています。rinnaは過去の研究と開発から得たノウハウを礎に、企業向けのカスタマイズソリューション「Tamashiru Custom」を提供しています。このソリューションにより、法人顧客は自身のニーズに合ったカスタムLLMを手に入れることが可能になりました。
rinnaは、継続的な研究開発を通じてAIの社会実装を推進し、取得した知識や技術をもとに新たな製品やサービスを展開し続ける意欲を示しています。
企業情報
rinna株式会社は「人とAIの共創世界」というビジョンを持ち、生成系AIモデルの研究開発に注力しています。テキスト、音声、画像など多岐に渡る生成技術を駆使して、ビジネス課題を解決するための革新的ソリューションを提供し続けています。親しみやすいAIキャラクター「りんな」を通じて、人とAIが調和する新たな未来を目指しています。
この新しいモデルの公式ウェブサイトや、導入を希望する企業の方々は、ぜひともrinnaにコンタクトを取ってみてはいかがでしょうか。