音声認識新技術
2024-07-31 13:45:06

LINE WORKSが音声認識の新技術「InterBiasing」を発表!国際学会に採択

LINE WORKS、音声認識の新たな一歩



ビジネスコミュニケーションツール「LINE WORKS」を展開するLINE WORKS株式会社は、新たな音声認識技術「InterBiasing」を発表し、音声・音響信号処理分野で権威ある国際学会「INTERSPEECH 2024」にてその論文が採択されたことを報告しました。

INTERSPEECHとは


「INTERSPEECH」は、International Speech Communication Association(ISCA)が主催する音声・音響信号処理における世界最大の国際学会です。今回で25回目の開催となるこの学会は、世界中の研究者や技術者が集まり、最新の研究や技術革新についての議論を交わす場としています。2024年の会期は9月1日から5日まで、ギリシャのコス島で行われます。

「InterBiasing」技術の概要


本技術は、音声認識システムの精度を向上させることを目的としています。具体的には、特定のキーワードリストを事前に用意することで、追加の学習なしに高精度な音声認識を実現します。特に、人名や専門用語、社内用語など、従来の学習データに含まれていない語彙の認識精度が格段に向上します。

本論文は、リサーチエンジニアの中込優氏やヘンチェル・ミヒャエル氏によるもので、今後の製品への応用が期待されています。「CLOVA Note β」といったAI製品への実装が見込まれ、ビジネスシーンでの活用が待たれています。

新技術の背景


音声認識技術は、近年、深層学習モデルに依存するEnd-to-End方式が主流となっていますが、この方式にはいくつかの課題があります。具体的には、学習データに登録されていない語彙の認識が難しく、そのために別途学習させる必要がありました。その結果、時間とコストがかかってしまいます。

「InterBiasing」技術では、キーワードを事前に与えることで、一切の追加学習を必要とせず、音声認識精度を引き上げる手法を提案しており、これにより音声認識の実用性が一層向上すると期待されます。

エンドツーエンド音声認識の未来


本論文で提案された「InterBiasing」は、従来のSelf-Conditioned CTC技術を発展させたものです。この技術により、音声認識モデルは特定のキーワードに基づいて発話内容を推測し、正確な認識結果を導き出すことが可能となります。これにより、音声認識技術のさらなる進化が見込まれています。

LINE WORKSのAI技術への取り組み


LINE WORKS株式会社は、ビジネス向けのAI製品やサービスの研究開発にも注力しています。今回の技術は、音声認識の精度向上に寄与するだけでなく、今後のプロダクト開発にも影響を与えるでしょう。さらに新しい機能やサービスの創出へと繋がることが期待されています。

まとめ


「InterBiasing」の採択は、音声認識技術における重要な進展を示しており、今後の応用に対する期待感が高まります。LINE WORKSが提案するこの新技術が、ビジネスシーンでのコミュニケーションをさらに円滑にすることを願っています。


画像1

画像2

会社情報

会社名
LINE WORKS株式会社
住所
東京都渋谷区神宮前1-5-8神宮前タワービルディング11階
電話番号

トピックス(IT)

【記事の利用について】

タイトルと記事文章は、記事のあるページにリンクを張っていただければ、無料で利用できます。
※画像は、利用できませんのでご注意ください。

【リンクついて】

リンクフリーです。