高性能音声認識AI「mocoVoice API」の英語対応開始
mocomoco株式会社は、その高性能音声認識AI「mocoVoice API」を新たに英語に対応させたことを発表しました。この新機能により、日本語のみならず英語の音声認識も行えるようになり、さらに両言語が混在する音声データも正確に処理することが可能となりました。これにより、企業の国際的なコミュニケーションやミーティングの効率化が期待されます。
新機能の特徴
mocoVoice APIの英語対応では、以下のような特長が備わっています:
高精度な英語認識
英語のネイティブスピーカーに加え、多様な英語のアクセントにも対応。これにより、さまざまな話し方の音声も正確に書き起こすことが可能です。
コードスイッチ対応
日本語と英語が混在した会話を正確に検出し、適切に書き起こす能力を持っています。これにより、バイリンガル環境での活用が容易になります。
具体的な活用シーン
この新機能は、さまざまな場面での利用が見込まれています:
- - 多国籍企業での会議議事録作成:会議中の日本語と英語の双方向のやり取りをスムーズに記録。
- - 英語プレゼンテーションの文字起こし:プレゼンターの発言を迅速に文書化。
- - グローバルウェビナーの字幕生成:視聴者に理解しやすい字幕を提供。
- - 海外取引先とのミーティング記録:国際的なビジネスシーンでの重要な議事録を確実に作成。
mocoVoice APIについて
mocoVoice APIは、音声認識業界での最高の性能を誇るOpenAI Whisperに基づいたシステムで、mocomocoの独自辞書アルゴリズムと高速化技術を備えています。以下の機能が特長です:
- - 圧倒的な処理速度:長時間の会議や講演でも、1時間の音声を最速3分で書き起こせる高速性。
- - 独自の辞書機能:専門用語や固有名詞も正確に認識し、日英両言語での辞書登録が可能。
- - ChatGPTによる高品質校正:自動で文法的に正確で読みやすい文章へと整形。
- - マルチメディア対応:音声ファイルだけでなく、動画からの音声抽出・認識が可能。
料金プラン
英語対応機能は、追加費用なしで全てのプランに含まれています。詳細な利用料金については、
こちらをご覧ください。
開発背景
グローバル化が進む中、日本企業における英語コミュニケーションの必要性が高まっています。特に、日本語と英語が混在する環境での正確な音声認識が求められるため、この機能が開発されました。
今後の展望
英語対応に加えて、他の主要言語への対応も進めていく予定です。また、mocoVoice demoページの提供を通じて、ユーザビリティを高めていきます。
サービス利用のお申込み
mocoVoice APIの利用を始めるには、以下のGoogle Formから申請が必要です。アカウントを作成すれば、すぐに新機能を試すことができます。
mocomoco株式会社の概要