SpiralAIがACL 2026での論文を通じて音声合成技術を革新
SpiralAI株式会社は、2026年に開催される自然言語処理分野の国際会議「ACL 2026」において、リサーチャー小峠陸登氏と代表の佐々木雄一氏による論文が採択されたことを発表しました。彼らの提出した研究は、音声合成の分野で特に重要な進展をもたらすものです。論文は2026年7月2日から7月7日にかけてアメリカのサンディエゴで発表される予定です。
ACLとは何か?
「ACL(The Association for Computational Linguistics)」は、自然言語処理分野で最も権威ある国際会議の一つです。今年2026年には12,148件の論文が提出され、そのうち19%が採択されるという高い競争率の中で、SpiralAIの研究はTop 50%という評価を受けました。これにより、同社が今後の技術開発において、重要な役割を果たすことが期待されています。
論文の概要
今回の論文は、「Data-efficient Targeted Token-level Preference Optimization for LLM-based Text-to-Speech」というタイトルで、日本語音声合成における大きな課題に焦点を当てています。特に、文脈に依存した発音の変化に関して、従来の手法では十分な精度が得られないことが問題視されていました。これに対して提案された新手法「TKTO(Token-level Kahneman-Tversky Optimization)」は、発話単位ではなくトークン単位での選好最適化を行い、日本語特有の音声生成問題に対処します。これにより、従来の方法では必要だったデータを大幅に削減することが可能となり、実験結果でも発音精度が39%向上し、文字誤り率(CER)は54%削減されることが確認されています。
今後の展望
この成果は、音声合成プラットフォーム「Kotodama」や会話型AIアプリ「梵そよぎAI - 0rigin -」など、様々なプロダクトでの利用が進められています。特に、日本語の多様な読み方やアクセント、イントネーションを精細に改善するための15万回以上のアノテーションは、今後の研究開発に大きく寄与するでしょう。SpiralAIは、さらなる高精度な音声合成技術の確立に向けた研究開発を這些進めていく方針です。
SpiralAIについて
SpiralAI株式会社は、東京都千代田区に本社を構える企業です。2023年に設立された同社は、大規模言語モデルを用いた先進的なAI技術を活用した新たなサービスの開発に取り組んでいます。代表的なプロダクトには、音声合成のプラットフォーム「Kotodama」と会話型AIの「梵そよぎAI - 0rigin -」があり、両者は高い精度での音声生成を可能にします。SpiralAIの公式ウェブサイトを訪れれば、さらなる詳細を確認できます。