生成AI音声探求の最前線、データアナリティクスラボの新たな取り組み
はじめに
2023年10月、データアナリティクスラボ株式会社は、エヴィクサー株式会社との共同研究の成果を発表しました。この研究は、総務省のプロジェクトに採択されたもので、生成AIによる音声コンテンツの判定技術に関する重要な成果を挙げています。特に、偽情報や誤情報がユーザーの信頼形成において深刻な課題となっている現代において、これらの技術の発展は意義深いものです。
共同研究の背景
本研究は、エヴィクサーが持つ音響信号処理技術とデータアナリティクスラボのAI・データ分析技術を組み合わせたもので、生成AIの普及に伴い、偽・誤情報の対策技術の高度化を目指しています。この取り組みは、より信頼性の高い音声コンテンツの生成と評価を実現するための基盤を築くことを目的としています。
研究成果の概要
研究は以下の四つの主要成果に分かれています。
1. 検証基盤の構築
本研究では、生成AIが創出する音声コンテンツの特性を分析し、様々な音声生成モデルに対応する検証基盤を整備しました。具体的には、日本語を含めた合成音声の分析に向けて、先端的な音声生成モデルであるTortoiseやXTTS、Qwen3-TTSの調査・比較を行いました。また、これにより、現実の生成AI環境に即した条件下での評価が可能となりました。
2. 合成音声データ生成と解析
次に、合成音声データの生成条件を整理し、音声信号(スペクトログラム等)の解析を行いました。その結果、自然音声とは異なる合成音声の構造的差異を明らかにすることができ、これは汎用的な判定技術の研究開発において重要なステップです。
3. 深層学習による判定モデルの検証
生成音声の特定に関しては、深層学習に基づくモデルの調査と検証を実施しました。AI音声特有の特徴を活かした判定モデルの開発は、今後の研究の基礎となるでしょう。特に学習用データセットの構築や判定精度の評価プロセスを整えることができました。
4. 音響信号処理とAIの融合
最後に、音響信号処理技術の専門家であるエヴィクサーと協力し、合成音声判定システムの強化を図りました。具体的な業務内容には、合成音声データの生成や多様な生成モデルの評価、音声信号の差異解析が含まれます。この取り組みは、EAFの判定精度向上に寄与するものです。
研究の社会的意義
生成AI音声技術の進展は、音声や映像コンテンツの信頼性の確保が重要な社会課題になっています。本研究の知見は、ディープフェイク対策や情報の真正性の検証、AIガバナンスに関する技術開発に貢献すると考えられます。
今後の展望
今後もデータアナリティクスラボは、エヴィクサーとのパートナーシップを通じて、音響信号処理とAI技術の融合による偽情報対策の分野でさらに貢献していく予定です。技術の進化に伴い、対策技術の向上に向けた新たな取り組みが期待されています。
会社情報
公式サイト
代表者:近藤 雅彦
所在地:東京都中央区築地5-4-18 汐留イーストサイドビル6階
設立:2019年4月26日
資本金:2,000万円
事業内容:データ分析・AI活用支援、AI開発、データ人材教育サービス
お問い合わせ
本件に関するお問い合わせは、データアナリティクスラボ株式会社の広報担当までEメールでご連絡ください。
[email protected]