パナソニックHDが最先端のマルチモーダルAI「LaViDa」を発表
パナソニックR&Dカンパニー オブ アメリカ(PRDCA)とパナソニック ホールディングス株式会社は、UCLAの研究者と協力し、拡散型視覚言語モデルを用いた新たなマルチモーダルAI「LaViDa」を開発しました。この技術は、テキストや画像など複数の情報形式を同時に扱える機能を備えており、AIの進化を象徴しています。
マルチモーダルAIの進歩
近年、マルチモーダルAIの重要性は増しており、特に大規模言語モデルの成功によってその性能が飛躍的に向上しています。しかし、従来の自己回帰型手法では、生成する文の量が増えるにつれて生成時間が長くなるという課題がありました。この問題に対処するために、LaViDaでは拡散モデルを採用し、生成時間を可変にすることを可能にしました。その結果、既存の手法の精度を保ちながら、約2倍の高速化を実現したのです。
国際的な評価
この新技術は、国際的にも注目され、AI・ML界のトップカンファレンスであるNeurIPS 2025において採択されました。2025年12月3日から5日までアメリカのサンディエゴで開催されるこの会議で、LaViDaの詳細が発表される予定です。これは、技術の先進性が広く認められた証でもあります。
業務効率化の実現に向けて
パナソニックグループでは、全社的に業務の効率化と自動化を目指す中で、AIエージェントの導入が進められています。しかし、現場にある様々な形式のドキュメントや資料は、すべてがAIにとって理解しやすいわけではありません。LaViDaを通じて、異なる形式を統一したフォーマットに整形することで、AIエージェントの導入プロセスを加速させることが期待されています。
パナソニックHDは、今後もAI技術の研究・開発に力を入れ、社会への実装を加速させることで、日常生活やビジネスの現場において有用な技術を提供することを目指しています。
結論
LaViDaの開発は、技術的な革新だけでなく、業務の効率化や自動化を進める上での重要な一歩となります。今後の展開に期待が寄せられる中、AIの進化がどのように私たちの生活に影響を与えるのか、注目が集まります。
詳細は公式のプレスリリースをぜひご覧ください。
プレスリリース
関連情報も充実していますので、以下のリンクもお見逃しなく: