Visual Bankが7万時間の日本語音声データを追加提供
Visual Bank株式会社(東京都渋谷区、CEO 永井真之)は、傘下のアマナイメージズを通じて、AI学習用データソリューション『Qlean Dataset(キュリンデータセット)』の音声データセットを大幅に拡充しました。新たに加わった音声データは、なんと7万時間を超えるボリュームを誇り、様々なシーンに対応した内容が含まれています。
Qlean Datasetの特徴と利用方法
このデータセットは、『データレシピ』という、用途や精度、納期に応じて柔軟に組み合わせられる商用利用可能なオリジナルデータラインナップを提供しています。データは一部アノテーション済みや未付与のものも含まれ、個別要件に応じた構成変更も対応可能です。
また、株式会社千葉ロッテマリーンズや株式会社東洋経済新報社とのパートナーシップを通じて、様々なジャンルのデータを収集。これにより、AI開発におけるデータ管理の負担を大幅に軽減し、開発スピードが向上します。
複数の音声収録形式
今回追加された音声データには、以下の多様な収録形式があります。
- - 1話者音声: 独白や朗読、教育講義から文化・芸能コンテンツまで、多様な変化を持つ音声データが収録されています。
- - 2話者音声: ビジネス会話や医療シナリオ、子ども同士の自然な会話など、リアルな対話を再現したデータが特徴です。
- - 3話者以上の音声: グループ会話やメディア系音声(テレビ番組や映画シーン)を含み、実際の生活に即したコミュニケーションを分析するために活用されます。
これらのデータは、自然言語処理や音声認識AIの精度向上、さらには会話型AIの自然対話学習や教育・医療分野での専門シナリオ構築などに利用が可能です。
商用利用の安心感
Visual Bankが提供するすべてのデータセットは、権利処理が完了しており、商用利用が可能です。研究開発やビジネス利用において安心して活用できます。また、『データレシピ』を通じて、初期投資を抑えたデータ調達も可能になります。
アカデミア支援プログラム
Visual Bankは、アカデミア支援の一環として、データセットの無償提供プログラムも開始しました。大学や研究機関、非営利の技術開発チームへ、高品質で権利クリアなデータを提供し、研究現場のデータ不足を解消することを目指しています。
このプログラムでは、画像や音声、動画、テキストなど、80種類以上・50万点超のデータが提供され、より幅広いリサーチが可能になります。詳細は公式サイトにて確認ください。
まとめ
Visual Bankが提供するQlean Datasetの多様な音声データセットは、AI開発者にとって非常に重要なリソースです。データのバリエーションや商用利用のしやすさが、その特長をより際立たせています。今後もビジネスと研究を豊かにするためのデータ提供が期待されます。
興味がある方は、ぜひ
Qlean Datasetの詳細をご確認ください。