音声・音響信号処理分野の国際会議 "ICASSP 2025" における主著論文採択
株式会社AI Shift(東京都渋谷区)は、音声・音響信号処理分野における国際会議"ICASSP 2025"で、長澤春希と大竹真太の主著論文が採択されたことを発表しました。この会議は、IEEE Signal Processing Societyが主催し、50回目の開催にあたる重要なイベントです。
ICASSPとは
ICASSP(International Conference on Acoustics, Speech, and Signal Processing)は、音声認識、音響信号処理、機械学習など、様々な分野の研究者が集まる国際的なプラットフォームです。2025年4月にインド・ハイデラバードで開催される予定で、各国からの参加が見込まれています。このたびの論文は、音声認識技術における最新の研究成果を発表する場となります。
研究の背景
近年、機械学習技術の進化に伴い、ボットや自動応答サービスの需要が増大しています。AI Shiftは、コールセンターでの自動応答の実現や、生成AIの導入を通じて、これらの技術を実用化するために活動しています。特に自社が開発した「AI Messenger Voicebot」は、精度の高い音声認識や終話判定といった技術を駆使し、プロダクトの品質向上に寄与しています。
AI Labでの研究活動
親会社である株式会社サイバーエージェントのAI Labでは、音声広告やデジタルツイン音声の研究が進められています。また、接客対応や対話エージェントの実現を目的に「完全自動対話研究センター」を設立し、継続的に研究開発に努めています。今回の主著論文は、CAゼミ制度を通じて行った「対話モジュール開発ゼミ」の成果の一環です。
論文の内容
採択された論文は、低リソース言語における自動音声認識(ASR)の向上を目指す研究です。従来、データの量や質が限られた環境でのファインチューニングは過学習のリスクがありました。これに対処するために、task vectorに基づく適応手法を提案しました。自由度の高いこの方法により、リソースが限られたシナリオでも効果的にモデルを調整できることが期待されます。
今後の展望
今回の研究成果は、AI Shiftが提供する音声認識技術を活用したプロダクトに応用されることが見込まれています。特に学習用のドメインデータ作成が困難な場合でも、近しいデータを使用することで、ASR性能が向上すると考えています。また、task vectorを活用することで、ドメインの変更があっても再学習なしで対応可能です。
企業情報
株式会社AI Shiftは、AI技術を活用した業務改善を推進し、AIを必要とする企業や人々に最適なソリューションを提供することをミッションに掲げています。今後も、技術革新と学術研究への貢献に注力していく予定です。詳細は
公式サイトをご覧ください。