主要メディアのLLM通過率、驚きの結果が明らかに！

先日、株式会社トドオナダが実施した大規模調査の結果、国内の主要3,166媒体が生成AI（LLM）の事前学習データパイプライン通過率に関する驚くべき事実が明らかになりました。この調査は、自社が提供するPR効果測定サービス「Qlipper」に搭載されたLLMフレンドリーチェック機能を用いて行われました。

調査の結果、当該媒体において生じた通過見込み率はわずか10.0%（317件）に過ぎないことが判明し、「条件付き通過」を含めても33.6%（1,063件）としています。これにより、残りの66.4%（2,103件）が生成AIの学習にとって実質的に排除されていることが確認されました。

生成AIとWebコンテンツの関係

生成AI（LLM）による言語モデルは、Web上の大量の文書を学習することで成り立っていますが、すべてのコンテンツが対象となっているわけではありません。各社のAIベンダーは、いくつかのフィルタリングを経て学習データを選定しています。特筆すべきは、robots.txtが許可されているにもかかわらず、サーバー側でAIクローラが拒絶されるケースが増加しているという点です。特に、CDNを提供している大手企業では、AIボットをデフォルトでブロックする機能が導入される予定です。

調査結果の詳細

調査の結果を細かく分析すると、通過不可の最大要因は「robots遮断」にとどまらず、主に「コンテンツの品質」が影響していることが明らかになりました。クレンジング段階で基準を満たさずに脱落するサイトが64.2%にも上り、実際の運用現場では、「AIがメディアをブロックしている」という一般的な認識とは裏腹に、コンテンツ構造が最大の壁となっていることが判明しました。

さらに、広報活動における重要な手段であるプレスリリース配信も、この調査によって期待外れの結果が出ています。たとえば、主要なワイヤーサービスはrobots.txtを開放しているにもかかわらず、30%が「即捨て」と判断される実態が示されました。これは、新しいメディアとの関係構築が求められる時代が到来していることを示唆しています。

広報業界への影響と必要な対応

広報担当者は、これまでの「どの媒体に載るか」という考え方から、「どの媒体ならLLMに届くか」へと思考を広げる必要があります。この調査により、広報活動のポートフォリオも見直される必要性が浮き彫りとなりました。特に、時間をかけて築いてきたメディアとの関係性が、生成AIの影響を受ける新たな状態に変わりつつあることを認識し、柔軟に適応することが求められます。

そのための具体策として、より多くの広報担当者が、ロボットによるクローリングが許可されているにも関わらず、どのようにコンテンツがAIにアクセスされ、学習されるかを確認する必要があります。これにより、媒体との関係の適切な設計が可能となり、より多くの成功例が生まれることでしょう。

まとめ

現在の広報活動は、LLMの発展により、新たなフェーズを迎えています。クオリティが求められる時代において、メディアの特性を理解することが、クライアントのメッセージを正しく伝える鍵となります。株式会社トドオナダの取り組みとして、LLMフレンドリーチェック機能による迅速かつ定量的な分析を提供し、広報の未来を切り拓くためのサポートを展開していく所存です。