Visual Bank株式会社が自社の推進するAI学習用データソリューション「Qlean Dataset」に新たに「日本語・1話者・台本朗読音声コーパスとトランスクリプト」を加え、提供を開始しました。このデータセットは、音声認識や自然言語処理、大規模言語モデルなどのAI技術に向けて活用されることを意図しています。
Qlean Datasetの目的
この新しいデータセットには、日本語の台本があり、日本人男性の話者がこれを朗読した音声と、その内容を正確に書き起こしたトランスクリプトが含まれています。これにより、音声とテキストの関係が明確に示され、特に音声認識における精度評価やモデル検証に役立つことが期待されています。データは一話者による朗読形式で収録されており、自然な会話の中でよく見られる言い直しや話題の逸脱を抑えた構成となっています。
データセットの仕様
- - データ種別: 音声、テキスト
- - 収録話者: 日本人男性
- - データ形式: 音声データ(mp3)、テキストデータ(txt、json、csv)
- - 音声サンプリングレート: 44.1kHz/48kHz
このデータセットは、ASRモデルの基礎評価、日本語音声認識における精度検証、音声入力を変換するための前段処理の検証、教育や比較検証に必要な評価用データとして幅広く利用されることができます。
「AIデータレシピ」の一環としての提供
Qlean Datasetは、商業利用向けに権利処理や利用条件を整理したデータ提供を行っており、研究から商業利用まで幅広く対応しています。その目的は、日本語の音声とテキストの関係を扱うAIの開発や、その検証環境の整備にあります。加えて、Visual Bankが展開する「AIデータレシピ」において、業界特化型の最新データラインナップを提供することで、より多様なニーズに応えています。
データの活用事例
具体的なユースケースとしては、
- - 研究用途: 日本語ASRモデルの評価
- - 産業用途: 音声言語処理パイプラインの検証
- - その他のニーズ: 音声システムの学習・評価用データとしての利用が挙げられます。
定期的なデータ提供
Qlean Datasetでは、1日以内の短期間での納品が可能で、カスタム収録にも対応しています。これにより、様々なデータ収集のニーズにきめ細かく応えています。
Visual Bank株式会社は、今後も独自のデータインフラを通じてAI開発を支援し続け、より多くのデータを提供することを目指しています。この取り組みにより、AI開発を促進し、より安全で効果的な学習環境を提供できるよう努めています。