アリババグループは、最先端のオープンソース大規模言語モデル(LLM)「通義千問(Qwen)」の最新バージョン「Qwen3」を発表しました。このモデルは、これまでのLLMの枠を超えた革新的な機能を備え、AI技術の新境地を切り開くことを目的としています。
ハイブリッド推論の導入
Qwen3は、初めて通常型モデルとハイブリッド推論モデルを搭載しており、これにより考える力と迅速な応答能力を兼ね備えています。具体的には、ユーザーのニーズに応じて、複雑な数式処理やコーディング、論理的推論などのタスクを処理する「思考モード」と、迅速な応答を可能にする「非思考モード」をシームレスに切り替えることができます。これにより、開発者は更に創造的なアプリケーションを構築できます。
多彩なモデル提供
Qwen3には、6つの通常型モデルと2つの混合専門家(MoE)モデルが含まれており、デバイスの特性に応じて最適な性能を引き出すことができます。特に、Qwen3-235B-A22B MoEモデルは、他の先駆的なモデルと比較してコストを大幅に削減できるため、コストパフォーマンスの良い解決策を提供します。
巨大なデータセットで訓練
Qwen3は、36兆ものトークンで訓練されており、多言語対応が強化されています。全119言語と方言に対応しており、業界内でも高い精度を誇ります。さらに、エージェント統合の能力が強化され、オープンソースモデルの中でリーダーとしての地位を確立しています。
業界ベンチマークでの実績
Qwen3は、複数の業界ベンチマークにおいてトップクラスの成果を達成しています。特に数学的推論やコーディング能力においては、過去のバージョンを上回る実績を誇ります。これには、長文思考連鎖(Chain-of-Thought: CoT)による初期学習、推論ベースの強化学習、思考モード統合、汎用強化学習(General Reinforcement Learning)などの4段階の学習プロセスが利用されています。
社会へ開かれたAI
Qwen3は、Hugging FaceやGitHub、ModelScopeを通じて無料公開されており、開発者たちは容易にアクセスが可能です。また、アリババのAI開発プラットフォーム「Model Studio」を利用したAPIが近日中に提供される予定です。このように、アリババは「誰もが高性能AIを活用できる世界」の実現に向けて大きな一歩を踏み出しました。
成長するオープンソースシリーズ
Qwenシリーズはすでに3億回以上ダウンロードされており、特にHugging Face上では10万件以上の派生モデルが開発されています。その人気は、オープンソースAIモデルとしての実績を裏付けています。ユーザーは、Qwen3を通じて、自らのクリエイティビティを発揮し、新たなAIアプリケーションの可能性を追求することができるでしょう。
アリババの「Qwen3」は、AI開発における大きな転機となることが期待されており、今後の展開に注目が集まります。