音声認識AIの新たな一歩
音声認識技術の進化は、様々な産業での利用を促進しており、その中でもデータ収集の効率化は特に重要な課題となっています。このたび、audioコーパス株式会社が新たに提供を開始したデータセット『職業面談』は、その解決策の一端を担うものです。これにより、職業面談という会話区分が加わり、データセット全体の提供時間数は150時間を超えることになり、AI学習のためのデータ収集作業が大幅に効率化されることが期待されています。
audioコーパス データセットの特徴
新しい『職業面談』のコーパスは、音声とテキストの両方をセットにした発話データで構成されています。これにより、開発者は自らデータをゼロから作成する必要がなく、必要な会話区分に基づいて迅速にAI開発を進めることが可能になります。具体的な特徴としては、以下のポイントが挙げられます。
1.
リアルな会話の収録:営業商談やコールセンターの対応、対談、面談など、各種会話のシーンを忠実に再現して収録しています。
2.
ステレオ収録:一対一の会話では、通常のRとLのチャンネルを分けたステレオ収録によって、より自然な音声を提供することができます。
3.
権利関係の整理:音声データに関しては、著作権や個人情報についての配慮を怠らず、本人の許可なく声を使用することは禁止されています。
さらに、テキストデータは十分な詳細度で提供されており、相づちやどもりなども忠実に書き起こされています。特に、フィラーや言い間違いに対しては、6つのタグを用意し、発話ごとに細かく区切ることで、データの分析や利用を容易にする工夫がされています。
発話データの製作背景
発話データは、市場に出回る堅実なデータが非常に限られています。その背景には、人の声が個人情報と見なされることがあり、無断での使用が難しいという問題があります。そのため、AI開発者は自前で音声データを取得し、さらにそれを使いやすい形式に整形する作業に多大な労力を要しています。
audioコーパスはこうした課題を理解し、必要なデータセットを提供することで、開発者の負担を軽減することを目指しています。その中でも新たにリリースされた『職業面談』データセットは、日常の自然な発話が多く含まれており、広く利用できる汎用性の高さが特徴です。
推奨される利用者
『職業面談』データセットは以下のような方々に特におすすめです。
- - 音声認識AIシステムの開発を行っている方
- - 利用目的の変化により、別の会話カテゴリが必要な方
- - 人の声のデータを探している方
- - コーパスデータを利用した研究を行っている方
購入方法と今後の展望
商品はお好きなカスタマイズが可能で、各カテゴリーに応じたサンプルも提供しています。興味のある方は、公式ウェブサイトを通じて問い合わせいただければと思います。今後もaudioコーパス株式会社は、音声認識AIの利便性向上に寄与し続ける取り組みを続けていくことでしょう。
企業情報
会社名:audioコーパス株式会社
代表者:森井直哉
所在地:東京都豊島区西池袋2-37-4 IKE・Biz 4F
事業内容:アノテーションデータの製作、販売および作成支援
公式ウェブサイト:
audioコーパス
音声認識技術の発展とともに、新たな市場が開かれることを期待したいものです。