Capy株式会社、LLM活用でログデータ分析を進化させた新しい取り組み

Capy株式会社、LLMを活用したログデータ分析に挑戦

Capy株式会社が、ITmedia Enterpriseにおいて自社のログデータ活用に関する最新の取り組みを発表しました。この取り組みでは、株式会社grasysと共同で構築した大規模言語モデル（LLM）を活用したログデータ分析基盤について詳しく紹介されています。これにより、従来はうまく活用されてこなかったログデータが、より適切な意思決定に寄与する形になっています。

ログデータ活用の重要性と課題

企業が日々生成するログデータは、その独自の背景や文脈を理解することで重要な情報を提供します。Capyでは、不正ログイン対策を行う「Capy CAPTCHA」の運用を通じて、アクセス元のIPアドレスや地域情報などを蓄積しており、攻撃の兆候やトレンドを把握するのに役立っています。しかし、このデータの量が非常に多く、専門的な知識が欠かせるため、効果的な活用には課題が残っていました。特に次のような点が挙げられます：

- データの膨大さ：毎日生成されるログが膨大で、その分析には多くのリソースが必要です。
- 専門知識の必要性：データを正確に読み解くには専門的なスキルが求められます。
- 属人化のリスク：特定のメンバーに分析が依存しやすく、継続的な運用が難しいことがあります。

LLMを活用したデータ分析基盤の構築

このような課題を解決するために、Capyは株式会社grasysと連携し、Google Cloud 上のデータプラットフォーム「BigQuery」を利用してログデータを収集しています。さらに、IPインテリジェンスサービス「Shodan」の情報とも連携して、Googleが提供するLLM「Gemini」による分析を行う仕組みを構築。データをそのまま処理するのではなく、分析目的に応じて必要な情報を的確に抽出・整理しLLMに入力することで、精度を向上させ、コストを最適化しています。

専門家の知見を活かし、ログデータやIP情報の文脈をしっかりと読み解くプロセスも設計されており、より深い分析が可能となりました。

効率化と的確な意思決定の支援

新たに導入されたこのシステムにより、以前は時間がかかっていたログデータの分析が効率化され、レポートの自動生成が可能になりました。生成されるレポートは、IPアドレスの所在地や使用されているインフラ、関連するリスク要因などを整理し、専門知識が無いユーザーでも簡単に理解できる形で提示されます。これにより、「