NABLAS株式会社が誇る新しいAIモデル「NABLA-VL」
NABLAS株式会社は、最新の大規模視覚言語モデル「NABLA-VL」を一般に公開しました。このモデルは、150億のパラメーターを誇り、日本語と英語の両方で高精度に情報を理解する能力を持っています。本モデルは、経済産業省とNEDOが共同で進めている「GENIAC(Generative AI Accelerator Challenge)」プロジェクトの一環として開発されました。
「NABLA-VL」は、テキスト、画像、動画を統合的に理解するための能力を備えており、産業界や学術研究における幅広い利用が期待されています。特に、バイリンガル対応ができる点は、国際的なビジネスシーンや教育現場での応用が大いに見込まれます。
モデルの特長と性能
「NABLA-VL」は、学習や推論の高速化を実現するためにトークン削減手法を取り入れています。この手法では、視覚トークンの87.5%を除去することに成功し、その結果、学習時間を約50%短縮しました。これにより、運用コストや開発時間を大幅に削減することができます。
また、2025年5月時点のベンチマーク結果では、「NABLA-VL」は日本国内の他のモデルと比較しても高い性能を示しました。特に英語領域での強さが目立ち、MMMUやLLaVA-Benchといった主要なベンチマークでトップのスコアを達成しています。さらに、OpenAIのgpt-4に対してもいくつかのベンチマークで優れた結果を出しています。
オープンソース化と技術の共有
このモデルはオープンソースとして公開されており、研究者や開発者が自由に利用できるようになっています。具体的には、Hugging Faceにてモデルと学習・推論コードがApache 2.0ライセンスの下で提供されています。技術的な詳細については、同社の技術ブログで詳しく説明されており、より多くの人々にAI技術の理解が促進されることを目指しています。
NABLAS株式会社について
NABLAS株式会社は、東大発のベンチャーであり、AI人材の育成と先端技術の開発に特化した研究所です。教育機関としての取り組みの他、コンサルティング業務を通じて様々な深層学習ソリューションを提供。企業のAI導入を助け、新たな技術の実装をサポートしています。未来の技術創造に向けて、「Discover the gradients, Towards the future」というミッションのもと、次世代の社会に貢献する技術の研究開発に注力しています。
今後の展望
今後、NABLAS株式会社は「NABLA-VL」を通じて、視覚と言語の融合技術の社会実装を進めていく予定です。また、軽量化やリアルタイム推論・高解像度画像理解など、さらなる研究開発も行う意向を表明しています。「NABLA-VL」が提供する新たな可能性は、未来のAI技術の発展に大きく寄与することでしょう。
大規模視覚言語モデル「NABLA-VL」に関するお問い合わせは公式Webサイトからどうぞ。
公式ウェブサイト