次世代音声認識モデル「shirushi-2.0」で進化する議事録AI

次世代音声認識モデル「shirushi-2.0」の登場

Nishika株式会社が新しくリリースした音声認識モデル「shirushi-2.0」は、業務用議事録AI「SecureMemo」に搭載され、会議の内容を迅速かつ正確にテキスト化することを目指します。これにより、企業の生産性が大幅に向上すると期待されています。

開発の背景

音声認識技術は日々進化していますが、特にビジネスシーンにおいて求められるのは「速さ」と「精度」、さらに「組織の固有語彙への適応」です。多くの企業から寄せられた声によれば、会議直後に議事録を確認したいのに時間がかかる、誤変換が多く修正に手間がかかる、そして自社だけの専門用語を認識できないという問題がありました。これを受けてNishikaは、問題の解消を目指して新たなモデルを開発しました。

shirushi-2.0の特長

「shirushi-2.0」は、これまでのモデルである「shirushi-1.5」と比較して、文字起こし処理速度が4倍に向上。ビジネス会議の音声を用いたテスト結果でも、この高速処理が顕著に表れました。また、名詞認識精度も改善され、句読点や表記の揺れに左右されずに、議事録の品質向上に寄与しています。具体的な改善例もあり、専門用語の誤認識が減少し、より実務に即した内容が提供できるようになりました。

改善された音声認識のサンプル

- Before: 本日一級建築施工科学歴史の結果発表が出ていますけれども、また改めて1024年度の受ける方は…

After: 本日一級建築施工管理技士の結果発表が出ていますけれども、また改めて2024年度の受ける方は…

このように、音声認識の精度が高まったことで、誤変換が大幅に減少しています。また、組織固有の用語にも柔軟に対応できる機能を持っているため、修正の手間をさらに削減できます。

2層構造での実現

「shirushi-2.0」は音声認識エンジンとして機能するだけでなく、Nishikaが既に発表したパーソナライズ校正機能と連携します。この2層構造により、ユーザーは使うほどに自身専用の設定が構築されていきます。このため、業務用語や社内の特有名詞を自動的に学習し、議事録作成の質が向上する仕組みが整っています。

提供形態について

「shirushi-2.0」はクラウド型の「SecureMemoCloud」への提供がまず行われ、その後はオンプレミス型の「SecureMemo」でも順次展開される予定です。既存のお客様には追加費用なしで新機能を利用可能です。また、無償トライアルも提供されており、興味のある方は気軽に試すことができます。

Nishikaの企業ビジョン

Nishika株式会社は「テクノロジーで全ての人が誇りを持てる社会を」をビジョンに掲げており、企業の会議をデータ化することで生産性の向上を目指しています。今後もこの取り組みを進め、ますます高性能のAI技術を提供していくことでしょう。
新たな議事録AIとしての「shirushi-2.0」に期待が寄せられます。