製造業の現場を変える映像解析型AIエージェントの登場
富士通が新たに開発した映像解析型AIエージェント「Fujitsu Kozuchi」は、製造業や物流などの現場に新風を巻き起こすことを目的としています。このAIエージェントは、現場に設置されたカメラ映像を解析し、作業指示や規則をもとに自律的に改善提案や作業報告を行うユニークな機能を持っています。
1. AIエージェントの開発背景
製造業や物流業界では現在、人手不足や熟練者の高齢化が深刻な問題となっています。これにより、生産性の確保や現場環境の安全性向上が求められており、AI技術の導入が期待されています。特に現場作業の支援においては、デスクワークと異なり、AIがより進化する必要があります。そこで富士通は、映像解析技術を駆使したAIエージェントの開発に着手しました。
2. 映像解析技術の革新
開発されたAIエージェントの核心技術は、マルチモーダル大規模言語モデル(マルチモーダルLLM)に基づく自己学習技術です。これにより、現場の3次元空間を映像認識しつつ、ドキュメント情報を組み合わせて理解増強が図られています。この技術は、従来の映像解析にとどまらず、長時間映像の精密な解析を可能にします。
3. 選択的注意技術
さらに、映像を効率的に解析するために採用されたのが「選択的注意」技術です。AIエージェントは、映像の中から関連性の高い情報を選択して記憶し、これを元にタスクを遂行します。この技術により、長時間の映像でも高精度な解析が実現されるのです。
4. 性能評価と展望
AIエージェントの性能評価のために、富士通は「FieldWorkArena」と呼ばれる評価環境をカーネギーメロン大学と共同で開発しました。この環境では、実際の工場や倉庫の映像を用いてAIエージェントの実務でのパフォーマンスを評価します。2024年12月からはGitHubやFujitsu Research Portalを通じて一般公開される予定です。
5. 展開の可能性
今後、富士通はこのAIエージェントを製造業だけでなく、店舗、交通、公共安全といった多岐にわたる分野に展開していく計画です。これにより、現場の作業環境が安全で効率的に改善されることを目指しています。
6. まとめ
この映像解析型AIエージェントが実装されることにより、従来の手法にとらわれない新しい現場作業支援が実現します。特に、デジタルトランスフォーメーションが進む中、AIを駆使した現場改善は、企業競争力を高める大きな要素となるでしょう。2025年1月からの社内実践および、2024年度内のトライアル環境の提供開始が待たれます。こうした技術革新が、製造や物流の現場をどのように変えるのか、今後の展開に期待が寄せられています。