30分で声再現
2022-05-18 11:00:14
約30分で「ゆりやん」の声が再現されるAI音声技術の新たな挑戦
約30分で「ゆりやん」の声が再現されるAI音声技術の新たな挑戦
吉本興業、声質再現の新技術を発表
吉本興業ホールディングス株式会社は、マネジメントやコンテンツ制作に強みを持つ企業であり、国内のエンターテインメント界で大きな影響力を誇ります。彼らが新たに、AI音声合成の世界でも注目を集める取り組みを発表しました。それは、もちろん彼らの人気芸人の一人、ゆりやんレトリィバァさんの声をAIで再現する実験です。このプロジェクトでは、約30分の音声データからゆりやんさんの独特な声色や話し方を再現する技術が開発されました。
AIによる音声合成の進化
今回の実証実験は、音声合成技術の最前線であるDNN(Deep Neural Network)を使用しています。この技術の進化により、今まで必要だった長い録音時間が大幅に短縮されました。従来、オリジナルの声を合成するには数十時間の録音時間が必要でしたが、今回のプロジェクトでは、わずか30分の録音で彼女の声をリアルに再現できることが証明されたのです。
以降、音声合成技術は、携帯電話の着信音や電子玩具などに利用されていますが、これまでは録音したデータに依存していました。今後は、PC上で簡単に発声・カスタマイズできるこの新しい技術を利用することで、いつでも、どんな状況でもゆりやんさんの声を再生することが可能になります。
新しいビジネスモデルの創出
「声の著作権化」という新たな概念も注目されています。これまで肖像権が重視されてきた分野において、今後は声を使ったライセンスビジネスが進展することが見込まれています。この実験により、芸人だけでなく、さまざまな分野のクリエイターたちが音声合成技術を活用するチャンスが増え、新しいビジネスモデルが確立される可能性が広がります。
まとめ
今回の実証実験から得られた大きな成果は、短時間で高品質な音声合成が可能であることです。この研究を通じて、ReadSpeakerの技術力が高いことが証明され、特に「機械的で不自然な音」を限りなく少なくし、彼女の個性的な声を違和感なく再現することに成功しました。今後はさらなる研究と開発が期待されており、私たちの声の可能性を感じさせる取り組みが続くことでしょう。
音声合成の未来
音声合成の発展は、エンターテインメントだけでなく、あらゆる産業に影響を与えるでしょう。今回のプロジェクトがきっかけとなり、声を持つコンテンツの制作が手軽に行えるようになることで、より多くのクリエイターが新たな表現方法に挑戦することが期待されます。そして、今後の新たなテクノロジーがどのような展開を見せるのか、ますます目が離せない状況となります。
会社情報
- 会社名
-
HOYA株式会社
- 住所
- 東京都新宿区西新宿6-10-1 日土地西新宿ビル 20F
- 電話番号
-
03-6368-5254