新たに誕生した会話型AIエンジン
2025年3月5日、カリフォルニア州サンタクララにて、Agora, Inc.(NASDAQ: API)が新たな画期的なソリューション「Conversational AI Engine」を発表しました。このエンジンは、開発者が任意のAIモデルに対してリアルタイム音声機能を追加し、超低遅延で自然な会話を実現することを目指しています。
近年、AI技術は急速に進化し、様々な分野でその利用が広がっていますが、多くのAIモデルは音声によるインタラクションに最適化されていないのが現状です。この問題を解決するために、Agoraの新しい会話型AIエンジンは、独自の形で音声機能を組み込む柔軟な設計を採用しています。開発者は、カスタムAIモデルや主要な大規模言語モデル(LLM)、さらに任意のテキスト音声変換(TTS)技術を利用し、スムーズな会話フローを実現できます。
音声対話を徐々に最適化
AgoraのCEO、Tony Zhao氏は「ほとんどのAIモデルは未だに音声によるインタラクションに対応しておらず、対応していても最適化が不足している」と指摘し、新ソリューションによってより自然でシームレスな会話体験が実現できると語っています。これにより、企業や個人の可能性が大幅に拡大します。
この新技術には、次のような機能が含まれます:
- - ノイズ抑制: 環境音を軽減し、クリアな会話を実現。
- - AI駆動の音響アルゴリズム: リアルタイムで高精度な音声処理を実施。
- - 超低遅延の音声認識(STT): 正確でスムーズな音声対話が可能。
- - Software-Defined Real-Time Network™: パケットロスを管理し、常に最適なパフォーマンスを提供。
この会話型AIエンジンは、Agoraが支持する「TEN(The Engager Network)」フレームワークの上に構築されており、企業は最小限の工数で自然なリアルタイム音声エージェントを展開できるようになります。さらに、今後は「App Builder」に統合され、コード不要で簡単にAIインターフェースが作成できる環境が整う予定です。
AIと人間のつながりを強化
Zhao氏は、AIと人間のインタラクションにおけるギャップを埋めることに焦点を当て、会話をより直感的で表現豊かにすることが目標であると強調しています。「AIモデルと人間のインタラクションを民主化し、人々がつながり、新たなコミュニケーションの形を築く基盤を作ることに尽力しています」。
Oracleと強力なパートナーシップ
さらに、Agoraは音声AIソリューションのパフォーマンス向上を図るためにOracleと提携し、そのスケーラブルなOracle Cloud Infrastructure(OCI)を活用しています。Oracle APACのHua Jiang氏は、音声対話における課題を解決する重要な一歩であると述べています。
多様な活用シーン
この新しいエンジンは、24時間対応のカスタマーサポートやスマートデバイスの音声操作、バーチャルショッピング、メンタルヘルス支援など、様々な場面で活用が期待されています。特に、ゲーム内のAIキャラクターや企業研修など、多岐にわたる分野での導入が想定されています。
本ソリューションの一般公開
現在「Conversational AI Engine」はパブリックベータ版として利用可能で、開発者や企業は早速その高機能な音声AIアプリケーションの構築に取り組むことができます。詳細は公式サイトをご覧ください。
Agoraについて
Agoraは、リアルタイムエンゲージメントをリードする企業として、音声やビデオなど多様なコミュニケーション手段を提供しています。サンタクララに本社を置き、1,700社以上の企業が、教育、ヘルスケア、ソーシャルメディアなどの分野でAgoraの技術を利用しています。