富士通が発表した生成AI再構成技術
富士通は、AIサービス「Fujitsu Kozuchi」の核心となる生成AI再構成技術を発表しました。この技術により、同社の大規模言語モデル(LLM)「Takane」が軽量化され、省電力性も大幅に向上しました。
新技術の概要
今回の再構成技術は、AIの各ニューロン間の結合に割り当てられる重みを極限まで圧縮する量子化技術と、特定の業務に特化した精度を持つAI蒸留技術の二つの基本技術から成り立っています。これにより、1ビット量子化を用いた際のメモリ消費量は最大94%削減され、精度維持率は89%と、これまでの手法と比較して非常に高い結果を見せています。
本技術の最大の利点は、従来の大型AIモデルを使う必要がなく、ローエンドのGPU一枚で高速な処理ができる点です。これにより、AIモデルはスマートフォンや工場などのエッジデバイスに実装可能になり、リアルタイムでの応答やデータセキュリティの強化が期待されています。
生成AI再構成技術の背景
生成AIの進展に伴い、その運用には高性能なGPUが多数必要となり、コストや環境への負担が課題として浮上していました。しかし、特定業務に合わせた高精度化や軽量化の技術がなければ、企業が生成AIを業務で本格的に導入することは困難です。それを解決するのが、「Takane」で用いられる本技術です。
生成AI再構成技術の構成要素
1. 量子化技術
量子化技術は、生成AIの思考を支える膨大なパラメータを圧縮することで、軽量化と省電力化を実現します。これまでの手法では量子化誤差が蓄積しやすく問題視されていましたが、新たに開発したアルゴリズム「QEP(Quantization Error Propagation)」により、その課題を克服しました。この技術により、LLMの思考を効率化し、電力消費を大幅に削減します。
2. 特化型AI蒸留技術
特化型AI蒸留技術は、基盤となるAIモデルの不要な知識を削ぎ落とし、必要な知識のみを効率的に抽出する方法です。これにより、ユーザーのニーズに合わせた音声アシスタントや画像認識エージェントなど、特化したAIモデルが作成されます。この技術は、商談の勝敗の予測に用いられており、実績として推論速度が11倍速くなり、精度は43%向上しました。
今後の展望
富士通は、生成AI再構成技術を利用し、「Takane」の進化を進めます。2025年度下期からは、この新技術を適用した「Takane」のトライアル環境を順次提供する予定です。また、金融、製造、医療、小売業界向けの軽量AIエージェントを開発・提供し、生成AIの可能性を拡張していくことを目指しています。最終的には、特化型「Takane」をさらに発展させ、複雑な課題解決に向けて進化させていくことを計画しています。
本技術により、富士通は持続可能な社会の実現にも貢献し、AI技術の持つ可能性を広げることに寄与していくでしょう。