rinna新モデル「Qwen2.5 Bakeneko 32B」の魅力
rinna株式会社は東京都渋谷区に拠点を置き、人とAIの共創を目指す企業です。同社は、これまでに様々な日本語に特化したAIモデルを開発してきましたが、新たに高性能な日本語大規模言語モデル「Qwen2.5 Bakeneko 32B」を発表しました。このモデルは、アリババ社が提供するQwen2.5 32Bを基に、日本語に特化した継続事前学習を施されたものです。
「Qwen2.5 Bakeneko 32B」シリーズとは
今回の発表に伴い、rinnaは「Qwen2.5 Bakeneko 32B」シリーズを公開しました。このシリーズには、対話形式での指示遂行を学習した「Qwen2.5 Bakeneko 32B Instruct」や、DeepSeek R1の高い思考能力を生かした「DeepSeek R1 Distill Qwen2.5 Bakeneko 32B」が含まれています。これらのモデルは高い日本語生成能力を持ち、特に会話や質問応答処理に適しているのが特徴です。
統計的な実績
rinnaの以前のモデルはHugging Faceプラットフォームで920万回以上ダウンロードされ、1200個のいいねがつくなど、多くの研究者や開発者から評価を得ています。そのため、今回の「Qwen2.5 Bakeneko 32B」を含めた新たなモデル群が、さらなる利用者に支持される可能性が高いでしょう。
各モデルの特徴
1.
Qwen2.5 Bakeneko 32B
- 日本語と英語のデータを使用し、継続的に学習したことで、日本語のテキスト生成能力が向上。
- マルチモーダル対応で、さまざまなタスクに利用可能。
2.
Qwen2.5 Bakeneko 32B Instruct
- 指示学習を通じて、対話形式での応答が得意。
3.
DeepSeek R1 Distill Qwen2.5 Bakeneko 32B
- DeepSeek R1からの知識蒸留により、日本語の思考能力を高め、一段と使いやすくなったモデル。
このモデル群は、今後のAI研究やビジネスにおいて様々な可能性をもたらすと期待されています。特に、データ生成においてコストの低減やセキュリティの強化につながることでしょう。
未来への期待
AI技術の普及に伴い、特に日本語の生成AIへのニーズがますます高まっています。ChatGPTの登場以降、AIが日常生活の中で利用されるようになっていますが、rinnaは「Tamashiru Custom」といったカスタマイズソリューションを提供し、顧客のビジネス戦略に即したLLMの提供を進めています。これにより、企業が求める機能や性能を持つモデルを、効率的に導入することが可能となります。
rinnaは今後も研究開発を続け、AIの社会実装を進めていく考えです。生成AIの活用を検討している方々へのサポートも強化しており、ビジネス上の課題解決に寄与し続けることでしょう。