NTT東日本、通信建設業界向け新たな安全支援AIの研究を発表
NTT東日本株式会社は、通信建設現場での安全性と効率向上を目的とした新しいAI技術の研究を発表しました。この技術は、視覚と言語を融合した「VLM(Vision-Language Model)」というマルチモーダルAIを活用し、安全管理の精度向上や業務のデジタルトランスフォーメーション(DX)を実現することを目指しています。
背景と目的
これまでNTT東日本は、約5,000台のネットワークカメラを通じて物体検知AIを導入し、不安全行動の検知や遠隔での見守りを行ってきました。AIによる判定は90%以上の精度を誇り、業務の効率化を達成してきました。しかし、旧来のAIモデルでは、現場の複雑な状況を正しく理解し、柔軟に判断することが難しいという課題が残っていました。
新たに導入されるVLM技術は、画像とテキストを同時に理解できるため、過去には難しかった作業指示の生成や状況説明が可能になります。これにより、安全確認の精度を向上させ、業務プロセスの高度化を図ることを目指します。最終的には、安全管理業務の効率を30%向上させる計画です。
取り組みの詳細
1.
高品質データセットの構築
精度の高いAIモデルを築くためには、多様なデータセットが必須です。NTT東日本は、長年の経験を通じて、量と質を兼ね備えたデータ収集のノウハウを育ててきました。新たなデータセットは、画像と業務知識を統合したVQA(Visual Question Answering)形式で作成され、高品質な合成データ生成手法を用いて効率的に構築される予定です。
2.
VLMの最適化
マルチモーダルAIとしてのVLMをファインチューニングし、通信業界に特化した機能を持つモデルを開発します。優先度の高い作業者や装備品の検知機能を拡張し、今後は16種類の対象に対応する計画です。これにより、安全確保に向けた柔軟かつ効率的な対応が可能になります。
3.
評価手法の確立
マルチモーダルAIの評価事例が少ないため、新しい評価手法を確立します。自然言語処理技術を用いた自動評価手法や独自データセットの作成により、精度の高い評価が行えるようにします。
今後の展望
2025年度中に研究を完了し、現場での実用化に向けた検証を進めていきます。NTT東日本のこの取り組みは、業務のDXに寄与するだけでなく、地域の顧客にも活用されることで、本質的な社会課題の解決に貢献していく予定です。最終的には、人間とAIが共創する未来社会の実現を目指しています。
お問い合わせ
本件に関するお問い合わせは、NTT東日本 先端テクノロジー部 デジタル技術部門 AI技術担当までご連絡ください。メールアドレスは:
[email protected]です。