パナソニックHD、AIモデル「SparseVLM」を開発
概要
パナソニックHDは、視覚情報を言語で理解するAIモデルである「Vision-Language Model」(VLM)の処理速度を約2倍に向上させる新技術「SparseVLM」を開発しました。この技術は、北京大学やカリフォルニア大学バークレー校などの研究者との共同作業により誕生しました。
VLMの課題
最近、VLMの開発において、視覚情報とテキスト情報を同時に処理する技術が注目されています。特に高解像度の画像や長時間の映像を扱う際、AIモデルに求められる情報量は増加します。このため、推論時間や演算量が増え、処理速度の低下が課題となっていました。
SparseVLMの特徴
新たに開発された「SparseVLM」は、関連する視覚情報のみを選択的に処理することで、この課題を解決しました。具体的には、入力プロンプトに関連した情報だけを集中して扱う手法を取ることで、質問応答精度を保ちながら、演算量や推論時間を大幅に削減することに成功しています。
国際的な評価
この技術は、AIと機械学習の分野で権威のある国際会議「ICML 2025」に採択されており、2025年7月にカナダのバンクーバーで発表される予定です。このことからも、SparseVLMが持つ先進性が広く認められていることが伺えます。
将来の展望
「SparseVLM」の開発は、AIが日常生活やビジネスシーンでより多く活用される可能性を秘めています。特に、ユーザーの状態や周囲の環境を迅速に認識し、言語化する必要がある分野での応用が期待されます。パナソニックHDは、この技術を社会に実装し、顧客の生活や仕事に貢献するための研究と開発を進めていく方針です。
参考リンク