PKSHA TechnologyとNAISTが音声合成技術で共同研究を開始

PKSHA TechnologyとNAISTの共同研究

株式会社PKSHA Technology（以下、PKSHA）と奈良先端科学技術大学院大学（NAIST）は、今後の音声合成技術を進化させるための共同研究に乗り出します。このプロジェクトは2026年6月からスタートし、少量の音声データからも自然で多様な発話を生成する新たな技術の開発を目指します。

共同研究の背景と目的

PKSHAはAI技術の社会実装を進めるため、音声認識や自然言語処理の分野での研究を行ってきました。一方で、NAISTは音声情報処理の分野で先端的な研究を行い、その成果は既に国際的に高く評価されています。両者の知見を融合することで、感情や話し方のニュアンスを豊かに反映した音声生成手法をさらに深化させることを目指します。

この共同研究は、「少量音声データから自然で豊かな発話表現を可能にする次世代音声合成技術の確立」をテーマに掲げており、具体的には対話AIや音声エージェントにおいて、多様で信頼性の高い音声コミュニケーションを実現することを目的としています。これにより、次世代音声AIの社会実装も加速化される見込みです。

PKSHAの実績と技術力

PKSHAは音声処理とナチュラルランゲージプロセッシングの基盤技術から直接サービスの展開まで広範な経験を持っています。特に、日本語音声合成技術において自然な発話を生み出すためのアクセント推定技術の開発に成功し、その成果をオープンソースとして公開しています。このような実績が、今回の研究における技術的基盤となるでしょう。

また、PKSHAはコンタクトセンターなどの実務環境においても音声データの活用を推進し、顧客のニーズに応じたソリューションを提供しています。この経験が、共同研究において社会実装を視野に入れた技術開発の強みとなると期待されています。

NAISTの研究力と成果

奈良先端科学技術大学院大学では、特にHuman-AI Interaction Lab（HAI Lab）が注目されています。この研究室は、音声の生成や認識、対話に関する基礎および応用研究を幅広く行っており、声の表現モデリングや話者の特性に基づいた発話表現の研究においても非常に多くの成果を上げています。さらに、国内外の学術会議における発表を通じて、国際的な評価を受けています。

NAISTは情報科学を基盤に、音声情報処理や自然言語処理分野での先端研究を牽引しており、その成果は音声合成技術のみならず、広範にわたる分野に応用されています。