博報堂DYホールディングスがICLR2025で論文採択
株式会社博報堂DYホールディングスは、シンガポールで開催される「ICLR(The International Conference on Learning Representations)2025」において主要な著作論文が採択されたことを発表しました。このカンファレンスは、機械学習や深層学習の分野における最も権威あるイベントの一つとして知られています。
ICLR2025には約11,500本もの論文が投稿され、採択率は32.08%という厳しい競争を経ての栄誉です。採択された論文は、4月に行われるカンファレンスでの発表が予定されています。
研究の背景と論文の概要
日常のビジネスシーンでは、広告配信やコンテンツのレコメンドなどの意思決定プロセスにおいて、過去の選択と、それに対するユーザーのフィードバックを記録したログデータが利用されます。これらのログデータを基に、新たに開発された意思決定モデルの性能を評価するための「オフ方策評価(Off-Policy Evaluation)」や、優れたモデルを学習するための「オフ方策学習(Off-Policy Learning)」に関する研究が進行しています。
しかし、ビジネスで使用されるログデータが新たなアクションを評価する際に不足していることがあります。たとえば、新規クーポンや新着コンテンツなど、以前は存在しなかったアクションが新たに追加されることがしばしばあります。また、予算や時間の制約により、必要な量のログデータが収集できない場合もあるため、既存の手法によるモデル評価の正確性が損なわれてしまいます。
新たな手法「COPE」の提案
このような課題に取り組むため、本研究では、指標の新しい推定法「COPE(Cross-Domain Off-Policy Evaluation)」が提案されました。この手法は、対象とするドメインのログデータに加え、異なるドメインから過去に収集されたデータも活用します。これにより、新たなアクションについての情報を補完し、不足しているログデータを補いながら意思決定モデルの学習と評価を進めます。
この手法により、モデルの性能評価がより正確になり、優れた性能を持つモデルを効率的に学習できるようになります。具体的な計算機実験の結果は、従来の手法よりも正確な評価と高性能モデルの学習ができることを示しています。
今後の展望
本研究の成果は、特に動画や音楽の推薦など、新規アクションの追加が避けられないアプリケーションにおいて活用されることが期待されます。また、個別化医療や教育分野など、十分なログデータの収集が難しい分野でも成果が役立つ可能性があります。様々な領域で、より正確で効果的な意思決定モデルの構築が可能となるでしょう。