mocomocoが新機能を発表
mocomoco株式会社は、その音声認識サービス「mocoVoice」に新機能「話者名推定」を追加した。これにより、議事録作成のプロセスがさらに効率化され、企業の生産性向上に大きく貢献することが期待されている。
新機能「話者名推定機能」の概要
この新機能は、既存の「話者分離機能」を強化し、AIが声の特徴や会話のコンテキストから話者名を自動で特定する仕組みだ。従来は発言者が「SPEAKER_01」や「SPEAKER_02」といった形式で表示されていたため、ユーザーが手動で修正しなければならなかった。この新機能を利用すれば、例えば「田中」「鈴木」といった実名がワンクリックで表示され、議事録作成の手間が激減する。
時間と工数の削減
この機能により、修正作業の工数は劇的に削減可能。テストでは、議事録仕上げに要する時間を最大90%も短縮できることが確認されており、企業における議事録作成の迅速化が進む。ユーザーはAIが導き出した推定結果を簡単に確認し、反映させるだけで済むため、煩雑な修正作業は不要になる。
コミュニケーションの明確化
話者名が明記された議事録は、会議に参加しなかった者や関係者にとっても非常に理解しやすくなり、会議の決定事項や担当者の特定も容易になる。このことは、後続のタスク実行を円滑に進めるために非常に重要だ。
ナレッジ共有の促進
また、発言者が明記されることでナレッジ共有も促進され、組織全体での情報の流れがスムーズになる。これは特に、リモートワークや多国籍チームでの業務において、必要な情報が知らされるため、重要な要素と言える。
開発に至った背景
mocoVoiceはこれまで高精度な文字起こしを実現してきたが、ユーザーからは「発言者が誰かを特定するのが大変」との不満も多く寄せられていた。会議参加者が多い場合、特に誰の発言かを特定することは大きな課題であった。このため、 AIの力を駆使して「話者名推定機能」の開発に取り組むことになった。
新機能の技術的背景
mocoVoiceの話者名推定機能は、大規模言語モデル(LLM)との組み合わせと独自アルゴリズムにより成り立っている。発言者の声の特徴や文脈を解析することで、誰が何を発言したかを見極める仕組みであり、精度は90%以上という非常に高い水準を実現している。また、音声を最速3分で書き起こすことができる高速処理も特徴的だ。
mocoVoiceの特徴
1.
現場に根差した高い音声認識精度: mocoVoiceは医療や金融など厳しい現場要件を満たす品質を実現。
2.
カスタマイズ可能な議事録: ユーザーにとって最も重要な要素をAIが自動で要約。
3.
オンプレミスでの対応: セキュリティが重視される業界向けのサービス。
今後の展望
mocomocoは今後もお客様の声に耳を傾け、さらに精度を向上させるための開発を進める。話者名推定機能のさらなる改良や、より直感的でシームレスなサービスを提供することを目指して日々努めている。
mocoVoiceのご利用方法
無料トライアルが用意されており、機能を気軽に試すことができる。法人プランのお申し込みなども公式サイトから可能。
公式サイトを見る