NVIDIA Cosmos 3
2026-06-01 16:14:35

NVIDIAが発表した次世代フィジカルAI基盤モデル「Cosmos 3」

NVIDIAがデザインした次世代フィジカルAIモデル「Cosmos 3」



台湾・台北にて行われたNVIDIA GTCで、同社のCEOであるジェンスン・フアンが新たなフィジカルAI基盤モデル「Cosmos 3」を発表しました。これは、ビジョンリーズニング、ワールド生成、アクション生成を統合した最新のmixture-of-transformersアーキテクチャを採用しており、フィジカルAIの分野で画期的な進化を遂げるものと期待されています。

壮大な進化を遂げたCosmos 3



「Cosmos 3」と呼ばれるこの新モデルは、テキスト、画像、動画、環境音、アクションなど、さまざまなデータをネイティブに理解し生成する能力を誇ります。これにより、従来のモデルでは数カ月かかっていた学習と評価にかかる時間をわずか数日に短縮できるのです。これはフィジカルAIの開発において非常に重要な進展を意味しています。

また、NVIDIAはこのモデルの開発に際し、Agile RobotsやGeneralist、Runwayといった著名な企業と連携する「Cosmos Coalition」を設立。次世代のフィジカルAIの開発を共同で行うことにより、業界全体におけるオープンな基盤モデルの発展を目指します。

フィジカルAIの基本課題に挑む



基本的な課題である「限られたデータと断片化されたシミュレーションスタックを用いた現実世界での汎化」に対処するため、Cosmos 3は全く新しいアーキテクチャを採用しています。このmixture-of-transformersアーキテクチャにより、オブジェクトの相互作用や動き、時間と空間の関係を理解する能力が向上。この理解に基づき、動作軌跡や動画を生成できるようになります。

開発者にとって多様な活用法



Cosmos 3は、さまざまなモダリティを理解するための視覚言語モデルや、物理環境をシミュレーションするための世界基盤モデルとして機能するほか、ロボットが特定のタスクを学習するための世界行動モデルのバックボーンとしても利用可能です。このように、開発者にとってその用途は幅広いものです。

各種ベンチマークにおいてもCosmos 3はトップクラスの結果を記録しており、オープンモデル同士の比較では、世界生成の精度、アクションポリシー、視覚理解の全てにおいて1位を獲得しています。

Cosmos 3シリーズのバリエーション



Cosmos 3には、開発者が必要に応じて選べるさまざまなモデルがあります。「Cosmos 3 Super」は、高度な物理精度と生成品質が求められる用途に最適なモデルであり、一方「Cosmos 3 Nano」は高速かつ高品質な動画生成を実現する、よりライトなモデルです。そして、リアルタイム推論のために設計された「Cosmos 3 Edge」も近日中に発表される予定です。

オープンな世界モデルの推進



Cosmos Coalitionの設立により、NVIDIAは業界一丸となり、オープンな世界モデルの開発を加速させています。各メンバーは、Cosmos 3のトレーニングツールや大規模トレーニング用インフラを活用し、フィジカルAIの迅速なイノベーションを実現することを目指しています。これにより、開発環境は一層充実し、開発者は効率的にプロジェクトを進めることが可能になります。

まとめ



NVIDIAの新しい「Cosmos 3」は、フィジカルAIの開発者にとって画期的なツールとなるでしょう。様々なモダリティをシームレスに統合する能力や、学習と評価の迅速化により、開発環境が大きく変わることが期待されます。NVIDIAの革新は今後の技術進化に大きなインパクトを与え、今から目が離せません。


画像1

会社情報

会社名
NVIDIA
住所
東京都港区赤坂2-11-7ATT New Tower13F
電話番号

関連リンク

サードペディア百科事典: NVIDIA 台北市 フィジカルAI Cosmos 3

Wiki3: NVIDIA 台北市 フィジカルAI Cosmos 3

トピックス(IT)

【記事の利用について】

タイトルと記事文章は、記事のあるページにリンクを張っていただければ、無料で利用できます。
※画像は、利用できませんのでご注意ください。

【リンクついて】

リンクフリーです。