日本語ビジネス会話音声データセットの登場
Visual Bank株式会社は、その傘下の株式会社アマナイメージズを通して新たに「Qlean Dataset」における日本語のビジネス会話音声コーパスと発話テキストデータセットの提供を始めました。このデータセットは、ビジネスシーンにおける自然な二者対話を数百時間分収録しており、音声認識(ASR)や会話理解、要約を行う人工知能(AI)向けの学習材料として利用されます。
データセットの特徴
本データセットは、日本人男女による音声とそのテキストデータを含んでいます。音声はWAV形式、テキストはTXT形式で提供され、収録時間は数百時間にも及びます。対象となるシーンには、商談やSaaSに関する問い合わせ、架電対応などが含まれ、詳細な書き起こしが行われています。
データ構成
データセットには、行番号、開始時間、終了時間、話者区分、発話内容などが明記されており、研究や商業利用に適した高精度な音声コーパスの提供を実現しています。
利用用途
このデータセットは、以下のような多様な用途に活用できます。
1.
音声認識・話者分離AIの高精度化
- オンライン会議や対面での会話を多種類の環境で収録しており、ノイズ耐性や被り発話に対応可能です。これにより、音声認識の性能を向上させ、リアルタイム議事録作成AIの開発に寄与します。
2.
会話理解・要約生成AIのトレーニング
- 精密な書き起こし構造が長時間の会話における要点抽出や要約生成AIの開発に最適なデータを提供します。
3.
顧客体験(CX)・感情音声認識AIの開発
- 声のトーンや発話の間など、感情的なニュアンスを捉え、顧客満足度を解析するのに役立つAIモデルの開発に利用できます。
4.
商談解析・セールスインテリジェンスAIの研究
- 営業などのビジネス対話を網羅し、発話パターンを数値化する商談解析AIやセールスコーチングAIに必要なデータを提供します。
5.
コンタクトセンター自動応対AI・FAQ生成AIの構築
- カスタマーサポートの実音声が含まれており、FAQ自動生成や音声応答型チャットボットのチューニングに活用できます。
6.
音声UX・会話体験デザインの研究開発
- 自然な会話テンポや相槌を含むリアルな音声データは、AIアシスタントやスマートスピーカーの設計に最適です。
『Qlean Dataset』の理念
Qlean Datasetは、すべての被写体から同意書を取得し、プライバシーに配慮した形でデータを提供します。研究や商用利用においても安全に利用できる環境を整えることが目的です。
また、Visual Bankは多様なデータ提供体制の強化を目指しており、音声、画像、動画、3Dなどのデータパートナーシップを拡大しています。この新しいビジネス会話音声データセットは、その一環で、AI時代における知的財産の保護とデータ価値の最大化を目指しています。
詳細は公式サイトをぜひご覧ください。