Capy株式会社、LLMを活用したログデータ分析に挑戦
Capy株式会社が、ITmedia Enterpriseにおいて自社のログデータ活用に関する最新の取り組みを発表しました。この取り組みでは、株式会社grasysと共同で構築した大規模言語モデル(LLM)を活用したログデータ分析基盤について詳しく紹介されています。これにより、従来はうまく活用されてこなかったログデータが、より適切な意思決定に寄与する形になっています。
ログデータ活用の重要性と課題
企業が日々生成するログデータは、その独自の背景や文脈を理解することで重要な情報を提供します。Capyでは、不正ログイン対策を行う「Capy CAPTCHA」の運用を通じて、アクセス元のIPアドレスや地域情報などを蓄積しており、攻撃の兆候やトレンドを把握するのに役立っています。しかし、このデータの量が非常に多く、専門的な知識が欠かせるため、効果的な活用には課題が残っていました。特に次のような点が挙げられます:
- - データの膨大さ:毎日生成されるログが膨大で、その分析には多くのリソースが必要です。
- - 専門知識の必要性:データを正確に読み解くには専門的なスキルが求められます。
- - 属人化のリスク:特定のメンバーに分析が依存しやすく、継続的な運用が難しいことがあります。
LLMを活用したデータ分析基盤の構築
このような課題を解決するために、Capyは株式会社grasysと連携し、Google Cloud 上のデータプラットフォーム「BigQuery」を利用してログデータを収集しています。さらに、IPインテリジェンスサービス「Shodan」の情報とも連携して、Googleが提供するLLM「Gemini」による分析を行う仕組みを構築。データをそのまま処理するのではなく、分析目的に応じて必要な情報を的確に抽出・整理しLLMに入力することで、精度を向上させ、コストを最適化しています。
専門家の知見を活かし、ログデータやIP情報の文脈をしっかりと読み解くプロセスも設計されており、より深い分析が可能となりました。
効率化と的確な意思決定の支援
新たに導入されたこのシステムにより、以前は時間がかかっていたログデータの分析が効率化され、レポートの自動生成が可能になりました。生成されるレポートは、IPアドレスの所在地や使用されているインフラ、関連するリスク要因などを整理し、専門知識が無いユーザーでも簡単に理解できる形で提示されます。これにより、「
- - セキュリティチーム内での議論がスムーズに進む
- - 顧客への説明が迅速に行える
- - 攻撃傾向の把握が効率的に出来る
」などの効果が生まれています。さらに、ログデータに基づいた判断や対応方針の策定がサポートされ、迅速な意思決定が可能になりました。