コトバテクノロジーズの音声生成
2024-10-29 11:03:16

コトバテクノロジーズ、日本語音声生成の新たな可能性を探るプレイグラウンドを発表

コトバテクノロジーズが音声生成の新潮流をもたらす



2023年10月28日、株式会社コトバテクノロジーズが最先端の日本語音声生成モデル「Kotoba SpeechGen」のβ版を公開しました。この画期的な技術は、同社が進める国内生成AI開発プロジェクト「GENIAC」の一環として開発され、より自然で流暢な音声生成を目指しています。

プレイグラウンド「Kotoba SpeechGen」の特徴



この新しいプレイグラウンドには、以下の三つの主な機能があります。

1. Preset Voiceの活用
従来の日本語TTS(Text-to-Speech)を上回る、より自然な音声生成が可能となるPreset Voice機能が搭載されています。

2. ボイスクローニング機能
自分の声や音声ファイルをアップロードして使用できるボイスクローニング機能が新たに追加され、個々のニーズに応じた音声体験を提供します。

3. 多言語対応の進化
リアルタイム性のさらなる向上に取り組んでおり、将来的には英語や東南アジアの言語への対応も予定されています。

残念ながら、プレイグラウンドの商用利用は不可ですが、商用利用可能なAPIも今後公開される予定です。プレイグラウンドへのアクセスはウェイトリスト制で、興味のある方は登録が必要です。

国内生成AI開発プロジェクト「GENIAC」の意義



コトバテクノロジーズは、経済産業省およびNEDO(国立研究開発法人新エネルギー・産業技術総合開発機構)が推進する国内生成AI開発プロジェクト「GENIAC」の第2期に採択されています。このプロジェクトの目的は、日本の生成AI開発力を強化し、国内外での競争力を向上させることです。

「GENIAC」では、音声基盤モデルと代表的な音声アプリケーションの開発を進めており、世界最大規模の高品質日本語音声データセット(40万時間)を生成・構築しています。このデータをもとに、8B(80億)パラメータの音声基盤モデルの学習を行い、リアルタイム性やアプリケーションへの展開を目指します。これにより、コトバテクノロジーズは市場でのベストオプションを考えた性能と速度を持つモデルの開発を進めます。

コトバテクノロジーズの背景とビジョン



株式会社コトバテクノロジーズは、米国のトップ学術機関でAIを研究していた二人が、スパコン富岳を活用し国産LLM(大規模言語モデル)の開発を行う研究者とともに設立した企業です。彼らはこれまでに多くのAI関連の会議で発表し、優れた成果を挙げています。

社名の「コトバ」は、紀貫之の詩からインスパイアを受けたもので、「人の心を種として、そこから生まれるものが言葉」と考えています。この技術が種となり、社会に広がっていくことを願っているといいます。コトバテクノロジーズは、日本を代表する生成AI企業に成長し、驚くべき技術開発の中心にいることを目指しています。

企業の未来に向けて



コトバテクノロジーズでは、最新技術を駆使した音声基盤モデルの開発を進めており、新たな音声アプリケーションの実現に向けて積極的に人材を募集しています。興味のある方は、ぜひ採用ページをチェックしてみてください。

[会社概要]
  • - 会社名: 株式会社Kotoba Technologies Japan
  • - 所在地: 東京都千代田区大手町1-6-1 大手町ビルヂング6階Inspiared.Lab
  • - 代表者: 代表取締役 小島熙之
  • - 設立: 2023年7月
  • - 事業内容: 音声基盤モデルの開発
  • - URL: kotoba.tech
  • - X: @kotoba_tech


画像1

画像2

会社情報

会社名
株式会社Kotoba Technologies Japan
住所
東京都千代田区大手町1-6-1 大手町ビル6F
電話番号

トピックス(IT)

【記事の利用について】

タイトルと記事文章は、記事のあるページにリンクを張っていただければ、無料で利用できます。
※画像は、利用できませんのでご注意ください。

【リンクついて】

リンクフリーです。