Visual Bankが新しい日本語ビジネステーマの対話データセットを発表

Visual Bank株式会社（東京都港区、代表取締役CEO 永井真之）は、傘下の株式会社アマナイメージズを通じて、AI学習用データソリューション「Qlean Dataset」の一環として「日本語・3話者ビジネステーマの対話音声・トランスクリプト」を提供開始しました。この新しいデータセットは、投資や保険といったビジネスシーンにおける自然な対話を収録した音声コンテンツで、AIモデル開発者にとって非常に貴重なリソースとなるでしょう。

ビジネステーマ対話音声データセットの概要

今回提供されるデータセットは、WEB会議形式で交わされた日本語の3人によるビジネス対話から構成されています。具体的には、性別や年齢に多様性を持つ13の日本人グループから成る会話を収録しており、内容のリアルさや業務における実際のコミュニケーションを忠実に再現しています。これにより、ASRモデルのドメイン適応や、多話者音声認識、言語モデル（LLM）のビジネス対話理解向上といった用途での活用が期待されます。

高品質なトランスクリプトの利点

本データセットは、全てのトランスクリプトが人手によって作成されています。これにより、専門用語の誤変換やフィラーの脱落、話者境界のずれなどを排除し、トレーニングデータの信頼性を高めています。自動書き起こしでは生じる可能性のあるノイズがなく、仕様が厳密な学習データとして非常に信頼性が高いです。

利用できるシナリオ

このデータセットは、商用利用が可能であるため、特にビジネス関連のAI開発者にとって価値があります。具体的には、ASR（自動音声認識）モデルの改善や、LLMのファインチューニングに役立てることができます。また、長尺の対話セッションを利用することで、議事録生成や要約AIの開発にも適していることが特徴です。約90分のセッションという長時間の収録により、より多くのデータを使用して、要約やアクションアイテムの抽出を正確に行うことが可能になります。

よくある質問

データセットに関するよくある質問も用意されています。例えば、3話者の構成が2話者データと何が違うのか、金融・保険分野での使用可能性、議事録生成や会議要約AIに向いているか、といった疑問に答えています。これにより、利用者が自身のニーズに合ったデータの活用方法を見つけやすくなっています。

Qlean Datasetについて

Qlean Datasetは、Visual Bankの傘下であるアマナイメージズが提供する商業用AI学習データソリューションです。高品質なデータを迅速に提供する体制が整っており、音声だけでなく映像やテキストなど、様々なモダリティに対応しています。さらなるデータの権利管理や利用可能性についても、明確なガイドラインが設けられています。

今後、このデータセットがどのようにAIモデルの開発に寄与するのか、業界からの注目が集まります。興味のある方は、ぜひデータセットをチェックしてみてください。