NVIDIAの新たな挑戦:Cosmos世界基盤モデルの登場
2025年3月18日、アメリカ・カリフォルニア州サンノゼで開催されたGTCにて、NVIDIAが革新的な技術「Cosmos世界基盤モデル(WFM)」のメジャーリリースを発表しました。この新モデルは、フィジカルAI開発向けのオープンかつ柔軟なリーズニングモデルとして位置付けられ、開発者にはリアルな世界を生成するための完全な制御を提供します。フィジカルAIの進化に向けた一環として、NVIDIAは同時に、Omniverseプラットフォームに基づいた二つの新しいブループリントも発表しました。
合成データ生成の進化
NVIDIAのCosmos Transferは、構造化されたビデオ入力からフォトリアルなビデオ出力を生成します。これにより、ロボティクスや自動運転技術において必要なトレーニングデータを、大規模かつ効率的に生成することが可能になります。初期導入企業には1X、Agility Robotics、Figure AIなどの名のある企業が揃い、これらの新技術を利用してデータ生成の効率化を図っています。
Agility Roboticsの最高技術責任者、Pras Velagapudi氏は、「Cosmosはリアルの枠を超えたトレーニングデータを生成する機会を我々に与えてくれます」と述べており、その期待の大きさが伺えます。
自動運転車の進化と多様な運転データ
自動運転車のシミュレーションにおいては、Cosmos Transferを利用した新しいブループリントが物理ベースのセンサーによるデータのバリエーションを増幅します。Foretellixは、天候や照明条件を変えることで多様な運転データを生成しており、これにより運転状況のシミュレーションがさらにリアルに進化します。また、Parallel Domainも同様のテクノロジーを取り入れ、自社のシミュレーションに応用しています。
Cosmos Predictとデータの迅速な生成
さらに、1月のCESで発表されたCosmos Predictは、テキストや画像、動画を基に仮想世界の状態を生成します。この技術は、開始と終了の入力画像を給油し、中間のアクションや動作の軌跡を予測できるマルチフレーム生成が特長です。これにより、開発者はフィジカルAIデータセットをもとに独自のモデルをカスタマイズすることが可能となります。
NVIDIAの最新技術であるGrace Blackwell NVL72システムは、このような高速かつリアルタイムな処理を支えるための計算能力を提供します。1X社はこの技術を用いてヒューマノイドロボットNEO Gammaをトレーニング中です。
フィジカルAIのための新たな合理化とAIの倫理
Cosmos Reasonは時空認識を取り入れた独自のリーズニングモデルで、ビデオデータを理解するための新たな視点を提供します。この技術を用いることで、開発者はフィジカルAIに必要なタスクをより効率的に指示できるようになります。さらに、データキュレーションのプロセスも改善され、動画検索や要約機能の向上に寄与しています。
NVIDIAは、信頼されるAI技術の開発に努め、すべてのCosmos WFMに対して新たなガードレールを設け、生成されたAIコンテンツへの透明性を確保しています。
これらの新技術はすでにNVIDIAのAPIカタログやGoogle Cloud上のVertex AI Model Gardenでもプレビュー可能で、今後の進展に期待が寄せられます。より詳細な情報は、NVIDIA GTCのセッションや基調講演で確認することができます。
NVIDIAは、フィジカルAIの進化に向けた新しい一歩を踏み出しました。これにより、未来の技術革新の可能性は広がり、さまざまな業界での応用が大いに期待されています。