新たなプライバシー保護データ解析プロトコルの開発
最近、統計数理研究所の村上隆夫准教授、電気通信大学の清雄一教授、産業技術総合研究所の江利口礼央研究員からなる研究チームが、新しいプライバシー保護データ解析プロトコル『local-noise-free protocol』を開発しました。このプロトコルは、個人データの漏洩を防ぎつつ、安全で高精度な頻度分布の推定を可能にします。具体的には、パーソナルデータを暗号化した上で中間サーバに送信し、その後の処理を行ってサービス事業者にデータを提供します。
研究の背景
近年、スマートフォンやIoTデバイスの普及により、個人の位置情報や身体活動データなど、多くのパーソナルデータが簡単に収集されています。しかし、このようなデータ解析にはプライバシーの懸念が伴うため、データの安全性を確保するために『差分プライバシー(DP)』という指標が広く利用されています。
差分プライバシーは、個人データの解析結果にノイズを加えることで、解析結果から個々のデータを特定されないように保護します。従来のアプローチでは、中央集権型モデルや局所型モデル、シャッフルモデルなどが用いられていますが、それぞれに特有の課題がありました。特に、シャッフルモデルは一部の悪意のあるユーザーによる攻撃に対して脆弱性を抱えていました。
研究成果
『local-noise-free protocol』の開発により、研究チームはこれらの問題を根本から解決しました。具体的には、ユーザーはノイズを全く加えることなくデータを中間サーバに送信します。中間サーバでは、データのランダムサンプリング、ダミーデータの追加、データのシャッフルという処理を行い、サービス事業者に提供します。
このプロトコルの最も革新的な点は、ユーザーがノイズを一切加えないことで、従来のシャッフルモデルが抱えていた『ポイズニング攻撃』や『結託攻撃』のリスクを大幅に軽減できることです。この新しい手法により、サービス事業者や一部の悪意を持ったユーザーによる不正の試みがあった場合でも、高精度な頻度分布の推定が可能になります。
さらに、研究では『非対称幾何分布』という新しいダミー数分布を導入することで、従来プロトコルに比べて誤差を大幅に削減することに成功しました。これにより、頻度の高いデータから低いデータまで、非常に正確なデータ解析が実現します。
今後の展望
新たに開発された『local-noise-free protocol』は、プライバシーを保護しながら高精度なデータ解析を実現するもので、位置情報を利用した観光地の人気の傾向分析や、ウェアラブルデバイスによる身体活動データの解析など、多岐にわたるユースケースに応用が期待されています。
今回の研究成果は、2025年に開催予定の『The 46th IEEE Symposium on Security and Privacy』で発表される予定です。本研究の支援には、日本学術振興会や科学技術振興機構による助成が含まれています。
私たちの個人情報の保護について今後さらに注目が集まる中、これらの技術の進展が期待されます。