NVIDIA、次世代GPU「Rubin CPX」を発表
2025年9月9日、カリフォルニア州サンタクララで開催されたAI Infra Summitにて、NVIDIAが新しいGPU「Rubin CPX」を発表しました。この新しいGPUは、大規模コンテキスト推論向けに特別に設計されており、数百万トークンに及ぶソフトウェアコーディングや生成ビデオの処理を革命的なスピードで行うことができます。
Rubin CPXの特徴と性能
新しいNVIDIA Vera Rubin NVL144 CPXプラットフォームの一部として、Rubin CPXはNVIDIA Vera CPUや他のRubin GPUと連携して動作します。この統合されたシステムは、8エクサフロップスのAIパフォーマンスを実現し、従来のNVIDIA GB300 NVL72と比較して7.5倍の計算能力を持っている点が際立ちます。また、100TBの高速メモリを搭載し、毎秒1.7ペタバイトのメモリ帯域幅を確保しています。
Rubin CPXは、長文コンテキスト処理における最高のパフォーマンスを提供し、トークン収益を最大化します。これまでの制約を超えた能力を持つことで、AIコーディングアシスタントは単なるコード生成ツールから、大規模なソフトウェアプロジェクトの理解と最適化を行うシステムへと進化します。
ビデオ処理における新たな可能性
AIモデルにとって、1時間のコンテンツを処理するには最大で100万トークンが必要です。これは、従来のGPUコンピューティングでは難しい領域です。Rubin CPXは、ビデオのデコーダーやエンコーダー、長文コンテキスト推論処理を単一のチップに統合することで、ビデオ検索や高品質な生成ビデオといった応用において新たな可能性を開きます。
ギャップを埋める技術革新
Rubin CPXは、NVFP4精度において最大30ペタフロップスのコンピューティング能力を持ちはじめ、多様なワークロードを高速化するための128GBのGDDR7メモリを搭載しています。また、NVIDIAのGB300 NVL72システムと比較して3倍の速度を持つアテンション機能を提供し、AIモデルの処理能力を向上させます。
この技術を用いて、Cursor、Runway、MagicといったAIイノベーターたちは、自社のアプリケーションの高速化を模索しています。CursorのCEO、Michael Truell氏は、Rubin CPXの進化に期待を寄せており、「これにより、生産性が新たなレベルに向上し、ユーザーが実現不可能だったアイデアを迅速に形にできる」と述べています。
また、RunwayのCEO、Cristóbal Valenzuela氏は、「Rubin CPXは、クリエイターにこれまでにないスピードとリアリズム、コントロールを提供することができる」と評価しています。
ソフトウェアサポートの充実
NVIDIA Rubin CPXは、エンタープライズ向けのAIエージェントに最適化されており、NVIDIA AIスタック全体からサポートを受けています。Dynamoプラットフォームは、AI推論を効率的に拡張し、スループットを劇的に向上させる役割を果たします。
発売予定
この新GPUは、2026年末に市場に登場する予定です。NVIDIAが私たちに提示する次世代の技術革新に期待が寄せられます。