AI学習用に特化した海外文学朗読音声データの提供開始

海外文学朗読音声データの新たな提供

Visual Bank株式会社は、その傘下の株式会社アマナイメージズを通じて、
AI学習向けデータソリューション『Qlean Dataset』に新たなデータセット『海外文学の朗読音声とトランスクリプト』の提供を開始しました。このデータセットは、音声認識技術の向上を目指した精度の高い音声データや自然な発話の合成が求められるTTS（Text-to-Speech）モデルの学習に最適です。

データセットの概要

このデータセットでは、日本語訳された海外文学作品を対象にしており、一人の日本人話者が物語や思想の深さを表現した落ち着いた朗読を提供しています。音声は30秒から90分までの長さがあり、録音形式も多様です。

- 音声データ形式: mp3
- テキストデータ形式: txt, json, csv
- サンプリングレート: 44.1kHz / 48kHz

これにより、文脈を保持する長尺音声の解析や高度な自然言語処理研究に役立てられます。

ユースケース

1. 研究用途

海外文学の翻訳に特有の長い文と複雑な修飾関係を有する日本語文に対して、このデータセットを利用することで、ASR（Automatic Speech Recognition）モデルの精度を検証することが可能です。また、ベンチマーク用データとしても役立ちます。

2. 産業用途

エンターテインメント分野では、オーディオブック制作やニュース記事の自動音声読み上げサービスにおいて、感情を抑えつつ情景を伝える音声合成エンジンの開発において、このデータは重要な役割を果たします。

3. 教育・社会実装用途

外国人向けの日本語学習において、正確な発音データとして使用され、発音矯正AIの構築や視覚障害者向けの読書支援デバイスにおける自然な朗読機能の実装に寄与します。

Qlean Datasetによるデータの提供

『Qlean Dataset』は商用利用が可能で、データ収集や整備の負担を軽減し、法的リスクのないAI開発を支援します。また、多様なデータ形式を提供しているため、画像や動画など多様な用途に対応可能です。

今後もVisual Bankおよびアマナイメージズは、良質な日本語資産を基にしたデータ提供を通じて、AI研究・開発の支援を継続していく意向です。

詳細情報は以下のリンクで確認できます。
Qlean Dataset公式サイト

これまでのデータの中で、特に文学作品に焦点を当てたデータセットは、様々な分野での応用が期待されており、研究者や開発者にとって貴重な資源となることでしょう。