mocomocoが新たに音声認識技術を提供
mocomoco株式会社が正式に音声認識クラウドサービス「mocoVoice API」をリリースしました。このサービスは、個人や企業向けに高性能なAPIを提供し、革新的な音声認識体験を提供します。今なら、利用開始後すぐにその精度と速度の違いを実感することができます。
mocoVoice APIの機能
mocoVoice APIは、音声からの書き起こしを基本機能として提供するだけでなく、以下のような特長を持った機能を充実させています。
- - 辞書機能: 特定の業界や専門分野に特化した辞書登録が可能で、一例として「マイナ保険証」といった用語も正確に認識します。
- - 読みなし辞書登録: 読みを指定する必要がなく、利用者の手間を大きく軽減します。
- - 高速推論: 1時間の音声を最短3分で書き起こすことができ、迅速な対応が可能です。
- - 自動校正機能: ChatGPTによる文章校正で、質の高いテキストを自動生成します。
- - 音声、動画両対応: 音声データだけでなく、動画データからの音声認識も可能です。
幅広い対象ユーザー
mocoVoice APIは、個人ユーザーから企業ユーザーまで、またニーズに応じた複数の料金プランを用意しており、プライバシー保護を重視する「学習なしプラン」や、サービス品質向上を目的にデータ利用を許可する「学習ありプラン」などが選択可能です。
料金プランの詳細
- - 学習なしプラン: お客様のデータはサービス改善には利用されません。特にプライバシーを重視したい方におすすめです。
- - 学習ありプラン: お客様データを匿名化して、サービスの精度向上に利用させていただきます。
料金は各プランごとに設定され、無料枠も設けられていますので、ぜひ自分に合ったプランを見つけてみてください。
導入実績
既に、ある企業では金融業界に特化した議事録作成サービスでmocoVoiceを導入しています。会議の効率化や情報共有の迅速化が実現されており、業界特有の用語にも対応しています。
開発の背景
一般的な音声認識システムは、専門用語への対応が難しいため、mocoVoice APIはその課題を解決するために開発されました。特に、音声認識にかかる時間とコストを抑えつつ、高い精度を保つことを目指しています。
技術的な特徴
OpenAI Whisperの技術を基盤にしつつ、mocomoco独自の辞書アルゴリズムと高速化技術により、より正確かつ迅速な音声認識を実現しました。
今後の予定
多言語対応や話者分離機能の追加も検討しており、ユーザーが簡単に試すことができる「mocoVoice Playground」が近日中にリリースされる予定です。
まとめ
mocomoco株式会社は、高性能な音声認識AI「mocoVoice」を通じて、日本のユーザーに向けた便利なサービスを提供し続ける考えです。最新情報は公式サイトにてご確認ください。ぜひこの機会に、高性能音声認識の世界を体験してみてください。