コムデザイン、OpenAIの音声認識モデル「Whisper」を採用した音声認識サービス提供開始!CTI「CT-e1/SaaS」が進化
株式会社コムデザインは、クラウド型CTI「CT-e1/SaaS」において、OpenAI社の音声認識モデル「Whisper」を活用した音声認識サービスの提供を開始したと発表しました。
「Whisper」は、OpenAIが開発した多言語対応の音声認識モデルです。様々な音声状況下でも高精度な認識を実現し、日本語音声のテキスト化においても高い評価を得ています。コムデザインは、「Whisper」の採用により、コールセンターにおける音声認識機能の精度向上と、ユーザーへの選択肢の拡大を目指しています。
従来のコールセンターでは、お客様とオペレーターの会話は別々のチャンネルで録音されるステレオ音源が一般的でした。しかし、「Whisper」はステレオ音源に対応しておらず、会話音声の分離が必要となります。そこでコムデザインは、独自の音声データ処理技術「センテンス認識」を開発しました。
「センテンス認識」は、会話中の無音部分を検知し、センテンス単位で音声データを分離することで、「Whisper」と連携できるようにする技術です。これにより、「Whisper」の性能を生かしつつ、リアルタイムでの音声認識を実現しています。
さらに、マイクロソフトとの連携により、Azure OpenAI Serviceを活用することで、「Whisper」との音声データ連携における課題を克服しました。今後も、マイクロソフトの技術を活用し、コンタクトセンター向けのサービスの充実を目指していく方針です。
「CT-e1/SaaS」は、コムデザインが提供するクラウド型CTIサービスです。低コストで導入しやすいだけでなく、機能の網羅性も高く、導入企業ごとの柔軟なカスタマイズが可能です。すでに1,745テナント31,000席以上の企業に採用されており、コールセンター業務の効率化に貢献しています。
今回の「Whisper」採用は、コムデザインのサービスをさらに進化させ、コールセンターのDX化を推進する取り組みの一環です。今後、音声認識機能のさらなる向上や、他のAI技術との連携を通じて、より高度なサービスを提供していくことを目指しています。
会社情報
- 会社名
-
株式会社コムデザイン
- 住所
- 東京都千代田区平河町2-7-5砂防会館本館3階
- 電話番号
-
050-5808-5500