第152回日本音響学会での発表
2024年9月4日から6日まで開催された第152回日本音響学会において、株式会社PoeticsのR&Dチームの山岡が、音声認識技術に関する新たな研究成果を発表しました。この研究では、擬似ラベルを利用して、固有表現などの出現頻度が低い語の認識精度向上を目指しています。
研究の背景
音声認識技術は、日々のコミュニケーションの効率を高めるために多数の分野で活用されています。特に、固有名詞や他の特殊な語彙は、会話の中で使用される頻度が少ないため、その認識精度が低いという課題があります。これに対処するため、研究者たちは高精度な擬似ラベルを使用し、人間による手作業でのトランスクリプションを不要にすることで、音声認識の精度を向上させる手法を開発してきました。
研究の成果
今回の研究では、膨大な音声データに基づく擬似ラベルを活用して、これまで認識精度が低かった単語の認識を効果的に向上させたことが確認されました。具体的には、ベースモデルと比較して、擬似ラベルを導入したことによる認識精度の向上が実証されました。これにより、実用的な音声認識システムの開発に向けた一歩を踏み出すことができたのです。
今後の展望
この研究を基に、今後はさらに良質なデータ選定を行い、少量のデータから高精度な音声認識モデルの構築を目指していく予定です。その結果、音声認識技術の進展だけでなく、業務効率の向上にも寄与することが期待されています。
JamRollの導入
Poetics社では、このような研究成果を活かして、AIを駆使した商談支援サービス「JamRoll」を展開しています。JamRollは、営業効率を高めるために会話を可視化するツールで、電話やオンライン会議の全ての会話を自動録音・録画し、文字起こしを行うほか、音声解析や感情分析も実施します。これにより、営業マンは自己学習をしながら、情報の共有を効率的に行うことができ、組織の成長に貢献することができます。
会社紹介
株式会社Poeticsは、2017年10月31日に設立され、東京都渋谷区に本社を置いています。代表者は山崎はずむ氏で、音声認識とAI技術を駆使した新しいサービスを提供し続けています。顧客からの支持を受け、2024年2月には豊橋技術科学大学との共同研究が日本音響学会で優秀賞を受賞するなど、その実績も高く評価されています。
公式ウェブサイトも是非ご覧ください:
Poetics社。