「ReazonSpeech」無償公開
2023-01-18 09:00:01

日本語音声認識モデル「ReazonSpeech」無償公開!商用利用も可能な高精度モデルで、音声認識技術の進化に貢献

株式会社レアゾン・ホールディングスは、世界最高レベルの高精度日本語音声認識モデル「ReazonSpeech」を、世界最大規模の日本語音声コーパスとともに、無償で公開したと発表しました。

「ReazonSpeech」は、同社が開発した高精度な音声認識モデルを中心とするプロダクト群で、OpenAI Whisperに匹敵する精度を誇り、商用利用も可能です。

同社は、音声認識技術の進歩には、高品質な音声コーパスが不可欠であると認識しており、「ReazonSpeech」においては、19,000時間にも及ぶ日本語音声コーパスを構築しました。これは、日本語音声認識技術の発展に大きく貢献する成果と言えます。

「ReazonSpeech」を用いた文字起こしサービスは、プロジェクトウェブサイトで実際に試すことができます。

開発の背景には、近年深層学習を用いた音声認識技術が飛躍的に精度を向上し、スマート端末などを通じて多くの人が利用できるようになったことがあります。

しかし、日本語では、商用利用を含めて自由に利用可能なコーパスが少なく、音声認識技術の発展と普及を妨げていました。

そこで、「ReazonSpeech」では、ワンセグ放送の録画データから音声コーパスを自動抽出することで、大規模な音声コーパスの構築を実現しました。

「ReazonSpeech」は、Apacheライセンス2.0にて公開されており、商用・非商用を問わず、誰でも自由に利用、改変、再配布することができます。

同社は、今後さらに大規模で高品質な音声コーパスのリリースや、多くの人が自由な音声コーパスの構築と共有に参加するための普及活動を実施していく予定です。

レアゾン・ヒューマンインタラクション研究所は、株式会社レアゾン・ホールディングスの企業研究所で、音声認識、視線認識、ジェスチャー認識、マニピュレータ制御など、様々な研究を行っています。同研究所では現在、研究員を募集しています。

会社情報

会社名
株式会社レアゾン・ホールディングス
住所
東京都新宿区新宿1-24-7
電話番号

トピックス(IT)

【記事の利用について】

タイトルと記事文章は、記事のあるページにリンクを張っていただければ、無料で利用できます。
※画像は、利用できませんのでご注意ください。

【リンクついて】

リンクフリーです。