AIエージェントによる業務システムUIの自動評価手法
2026年3月9日から13日にかけて開催される「言語処理学会 第32回年次大会(NLP2026)」において、全日本空輸株式会社(ANA)とDATUM STUDIO株式会社が共同で、AIエージェントを用いた業務システムユーザーインターフェース(UI)の自動操作及び評価手法に関する研究成果を発表します。この研究は、社内業務の効率化を目指したもので、特に大規模言語モデル(LLM)を活用しています。
研究の背景
ビジネスのデジタル化が進む現代において、企業は業務プロセスの多くをWebベースのシステムで実行しています。そのため、これらシステムのユーザーインターフェース(UI)の使いやすさが業務効率に大きな影響を与えるようになりました。しかし、社内システムは一般向けアプリケーションと異なり、ユーザー数が限られているため、リリース前に十分なユーザビリティテストを行うことが困難です。その結果、UIの使いやすさを定量的に評価する機会が少ないのが現状です。
さらに丁寧にテストがなされることが難しいため、多くの業務システムでは機能確認に留まってしまい、アクセスや操作のステップ数、エラー発生率に関する「使いやすさ」の評価が不足しています。
本研究の意義
本研究では、AIエージェントを利用して社内業務システムのUIを自動的に評価する新たな手法を提案します。これにより、実際にユーザーを集めてテストを行うことなく、業務システムのUI改善に向けたアプローチを可能にします。この手法の実践事例はまだ少なく、本研究は実務におけるAIの活用可能性を広げる重要な取り組みとして位置づけられています。
実際にANAの検証環境では、改修前後のUIの比較を行った結果、人による評価と一致する結果を確認しています。これにより、AIエージェントを用いた自動評価の信頼性と効果が証明されたと言えるでしょう。
NLP2026大会の詳細
NLP2026は、日本語や自然言語処理の研究成果を発表し、情報共有と交流を目的とした大会です。この年次大会では、研究者や実務者たちが集まり、最新の研究成果について議論が交わされます。当社グループ会社のちゅらデータもプラチナスポンサーとして協賛しています。
発表の概要
- - タイトル: LLMを用いたブラウザ操作エージェントによる社内システムのUIの自動評価手法の検討
- - 日時: 2026年3月10日(火)15:10~16:40
- - 会場: ライトキューブ宇都宮 C会場(C3-20)
研究チームの紹介
研究には、全日本空輸株式会社、DATUM STUDIO株式会社、ちゅらデータ株式会社のメンバーが携わっています。全日本空輸のデジタル変革室に所属する主なメンバーは、航空業界での業務経験を持ちながら、生成AIの導入に積極的に取り組んでいます。DATUM STUDIOとちゅらデータは、データ活用を通じたビジネスの成長を支える専門家集団として、幅広い分野でのデータ分析やシステム開発などのプロジェクトを手掛けています。
本研究成果の発表は、業務効率化の新たな可能性を示すものとして、今後のビジネスシーンでも大きな影響を与えることが期待されています。AI技術がどのようにして業務プロセスを変革し、企業の成長を促進するのか、その実際が展示される瞬間を楽しみにしたいものです。