三菱電機インフォメーションシステムズ株式会社(以下、MDIS)は、音声分離サービス「waketekoo」を2024年9月26日から発売開始します。このサービスは、対話を録音したモノラル音声を、話者ごとに分離しつつ、発話の重複部分であってもテキスト化できる点が特長です。MDISはこのサービスによって、顧客接点が多い企業が従業員と顧客間の会話を効率的に管理し、活用できることを目指します。
waketekooは、三菱電機のAI技術「Maisart®」を活用して開発されており、機能は「モジュール提供型」と「クラウドAPI型」の2つです。モジュール提供型では、既存の録音システムに容易に組み込むことが可能で、クラウドAPI型では音声のテキスト化機能をオプションで追加することができます。これらの提供形態は、ユーザーのニーズに応じて柔軟に対応することができます。
2024年10月17日・18日には、東京国際フォーラムで開催される「FIT2024」でwaketekooを紹介する予定です。これは音声認識技術の多様な活用が求められる中、技術的な課題を解決するための新たな一手として期待されています。
昇進する音声認識システムの需要の中で、多くの企業は従業員と顧客の対話を記録し、分析することで、業務の効率化に取り組んでいます。しかし、店頭でのモノラル録音では複数の話者からの音声を同時に記録する場合、音声を分離したりテキスト化することは難しいという課題が存在しました。waketekooは、この問題に対してコンパクトなアルゴリズムを用いて音声データの認識精度を向上させることで、利用者が求める機能を実現しています。
ユーザーにとってのメリットには、次のような点があります。まず、waketekooは会話音声を同時発話部分も含めて分離できるため、高い精度でのテキスト化を実現し、人手による文字起こしの手間を大幅に削減することが期待されます。また、参加者数に制限はなく、柔軟に利用できる点も優れています。しかし、音声の重複部分を分離する場合は2人までとなります。
導入のハードルを下げるため、価格設定も利用者に優しく設定されています。一般的にAIを使用する際に必要とされる高性能GPUではなく、より低コストで導入可能なシステム構成が可能です。また、1ユーザーからでも利用できる料金体系を用意しています。
確保された音声分離技術は、金融機関の店舗や訪問営業など、様々なビジネスシーンでのニーズに応えるものです。MDISは、今後5年間で10,000のユーザーライセンス導入を目指し、顧客応対品質の向上やコンプライアンスの確保、業務効率改善に寄与することを目標としています。
「waketekoo」という名称は、「wakeru(分ける)」と声の「echo」を組み合わせたもので、AI技術を活用して音声を分離するというこの技術の内容を伝えることを意図して名付けられました。興味のある方は、是非MDISの公式サイトから詳しい情報をご覧ください。詳細は、以下のURLをご覧いただくと、音声分離サービスの全貌が分かります。
waketekoo 紹介ページ
MDISは、金融業や製造業に特化したシステム事業を展開し、技術力やサービスを最大限に活用し、ITサービスの提供を行っています。今後もさらに多様な情報技術を駆使し、次世代のニーズに応える商品開発やサービス展開に力を入れていくことでしょう。