日本語VLM「Heron-NVILA-Lite-15B」
2025-05-12 11:41:42

チューリングが発表した150億パラメータの日本語VLM「Heron-NVILA-Lite-15B」

新たな時代のAIを切り拓く「Heron-NVILA-Lite-15B」



日本のAI技術の進化が加速しています。その象徴とも言えるのが、チューリング株式会社が発表した最新の日本語視覚-言語モデル「Heron-NVILA-Lite-15B」です。このモデルは、150億のパラメータを持っており、日本語環境に最適化された性能を誇ります。特に注目すべきは、「Heron-Bench」と呼ばれる日本語-画像応答ベンチマークでの73.5という高スコアです。これは、同じパラメータ規模の他のオープンモデルを上回る性能であり、日本のAI研究の一つの成果と言えるでしょう。

高速推論が可能な2Bモデル



加えて、チューリングは20億パラメータの2Bモデルも開発しました。このモデルは、特にiPhoneでもローカルで高速推論が可能という特性を持っています。これにより、ユーザーはインターネット接続なしで高性能のAI機能を利用することができ、より便利で手軽な体験を提供します。

GENIACプログラムの実施



この開発は経済産業省やNEDOの支援を受けた「GENIAC」プログラムの一環として行われました。このプログラムは、日本国内における生成AIの研究と開発の強化を目的としており、チューリングはその中で「Heron-NVILA-Lite-15B」などの成果を発表しています。特に、大規模データセット「MOMIJI」や「STRIDE-QAデータセット」など、他にも多くの成果が期待されているところです。

マルチモーダルモデルの重要性



自動運転を含むさまざまなAIの応用分野では、画像やテキストなどの異なるデータを一緒に扱えるマルチモーダルモデルが求められています。「Heron-NVILA-Lite-15B」は、そのニーズに応えるために開発されており、マルチモーダルな学習を通じて人間の感覚に近い状況認識を可能にします。完全自動運転の実現には、安全かつ正確な判断を行う能力が重要であり、このモデルはその基盤を支える役割を果たします。

MOMIJIとSTRIDE-QAデータセット



今回の開発には、インターリーブ形式で構築された「MOMIJI」が大きく貢献しています。このデータセットは世界最大規模を誇り、日本語の視覚-言語AIモデルを学習させるための重要な資源となっています。さらに、「STRIDE-QAデータセット」も注目の成果です。チューリングが東京都内で収集した自動運転データを元に構築されており、様々なシーンでの状況判断を数値化して提供します。

未来のAI技術への挑戦



チューリングは、この成果を踏まえてさらなる研究開発を進め、軽量でありながら高性能なマルチモーダルモデルの開発に注力しています。完全自動運転車の実現に向けた技術革新の取り組みは、今後も続けられることでしょう。

チューリングについて



チューリング株式会社は、2021年に設立され、現在では東京都品川区に拠点を置いています。同社は、自動運転技術の開発を手掛けており、常に新たな技術的挑戦を続けています。チューリングは、今後も日本のAI業界をリードする存在であり続けるでしょう。


画像1

画像2

画像3

画像4

画像5

画像6

画像7

画像8

会社情報

会社名
Turing株式会社
住所
東京都品川区大崎1丁目11−2 ゲートシティ大崎 イーストタワー4階
電話番号

トピックス(その他)

【記事の利用について】

タイトルと記事文章は、記事のあるページにリンクを張っていただければ、無料で利用できます。
※画像は、利用できませんのでご注意ください。

【リンクついて】

リンクフリーです。