Vengineerの妄想

人生を妄想しています。

NVIDIA Rubin/Rubin Ultraには、PCIe はついていないのを妄想する

はじめに

NVIDIAの Rubin/Rubin Ultraの die shot を眺めてみて、あれ、もしかしたら、PCIe ついていないんじゃないのかを妄想します。

それでは、

Let's 妄想

grok に聞いてみた

下記のように、grok に聞いてみました。

NVIDIAの次世代GPUアーキテクチャ「Rubin」および「Rubin Ultra」におけるPCIeインターフェイスの搭載可能性について、以下に調査結果をまとめます。調査は、提供されたWeb検索結果およびX上の投稿を基に、関連情報を分析し、推測を含めて整理しています。

1. X上の投稿によるPCIe非搭載の可能性

Xユーザーの投稿(@Vengineer)によると、NVIDIAのRubinおよびRubin UltraにはPCIeインターフェイスが搭載されていない可能性が指摘されています。具体的には以下の点が挙げられています:

  • Rubin世代のシステム(Vera Rubin NVL72やRubin Ultra NVL576)では、GPU間の接続にNVLink v6が使用されており、PCIeを必要としない設計になっている可能性がある。
  • 投稿では、Rubin Ultraのダイ画像を基に、すべての接続がNVLink v6に見えると推測されています。これは、PCIe用のSerDes(シリアライザ/デシリアライザ)が見当たらないことを示唆しています。
  • さらに、Rubin世代ではx86_64アーキテクチャとの統合が不要になる可能性があり、NVIDIA独自のVera CPUとNVLink-C2C接続を活用したクローズドなエコシステムを構築する方向性が示唆されています。

これらの投稿は、NVIDIAがPCIeを省略し、NVLinkを中心とした高帯域幅のインターコネクトに依存する設計を採用する可能性を強く示しています。ただし、これらの情報は個人の推測に基づくものであり、NVIDIA公式の発表ではない点に注意が必要です。

2. Web検索結果からの情報

Web検索結果からは、RubinおよびRubin UltraのPCIeインターフェイスに関する直接的な言及は限定的ですが、以下のポイントが関連しています:

  • NVLinkの優先採用:

    • Rubinプラットフォームは、NVLink 6(帯域幅3,600GB/s)やConnectX-9(1,600Gbps)といった高性能インターコネクトを採用しており、GPU間やGPU-CPU間の通信にNVLinkを多用する設計が強調されています。
    • Rubin Ultraでは、NVLink7インターフェイスがRubinの6倍のスループット(1.5PB/s)を提供し、システム全体の通信効率をさらに高めるとされています。
    • これらの情報から、NVIDIAがPCIeよりもNVLinkを優先し、データセンター向けの大規模システムで最適化を図っている可能性が伺えます。
  • PCIe Gen7の未成熟さ:

    • Rubinのリリース予定(2025年後半~2026年)時点で、PCIe Gen7の仕様策定は2025年に予定されていますが、商用化には時間がかかる可能性があります。
    • Vengineerのブログでは、PCIe Gen7の未確定な仕様を考慮し、RubinがPCIeを搭載する場合でもI/Oダイの再設計で対応可能と推測していますが、NVLink-HBI(ダイ間接続用)やNVLink-C2Cを活用する方が効率的であると述べています。
  • システムアーキテクチャの変化:

    • RubinおよびRubin Ultraは、Compute DieとI/O Dieを分離した設計を採用し、HBM4メモリやVera CPUとの統合を強化しています。
    • Rubin UltraのNVL576構成では、576個のGPUダイを1ラックに搭載し、NVLinkを介した高密度な接続を実現。PCIeを介した外部デバイスとの接続よりも、NVLinkによるGPU間通信が主軸となる設計が示唆されます。
  • データセンター特化の設計:

    • RubinプラットフォームはAIデータセンター向けに最適化されており、従来のPCIe依存のシステム(例:x86_64サーバーとの接続)から、NVIDIA独自のエコシステム(Vera CPU、NVLink、HBM4)への移行が進んでいる可能性があります。
    • 特に、Rubin Ultra NVL576の600kWラック設計では、冷却や電力効率を考慮したカスタムビルドが必要とされており、標準的なPCIeベースのサーバー構成とは異なるアプローチが取られています

3. PCIe非搭載の可能性を裏付ける間接的証拠

以下の間接的証拠から、PCIeインターフェイスの非搭載または大幅な役割縮小が推測されます:

  • NVLinkの性能優位性:NVLinkはPCIe Gen5(32GB/s双方向)と比較して、NVLink 6は1,800GB/s(片側900GB/s)以上の帯域幅を提供し、AIワークロードに最適。Rubin UltraのNVLink7はさらに6倍のスループット(1.5PB/s)を実現。PCIeの帯域幅では、NVIDIAの目指すスケールアップ型データセンターの要件を満たせない可能性が高い。
  • Vera CPUとの統合:RubinはVera CPU(Armベース、88コア、176スレッド)とNVLink-C2Cで接続され、x86_64依存を減らす方向性が明確。PCIeは主にx86サーバーとの互換性のために使用されるが、NVIDIAのクローズドシステムでは不要になる可能性がある。
  • HBM4とダイ設計:RubinはCompute DieとI/O Dieを分離し、HBM4を直接接続する設計を採用。I/O DieにはNVLinkやConnectX-9用のSerDesが含まれ、PCIe用のスペースが制限される可能性がある。

4. 反論:PCIe搭載の可能性

一方で、PCIeインターフェイスが完全に省略されない可能性も考慮する必要があります:

  • 互換性と市場ニーズ:データセンターの一部では、既存のx86サーバーやストレージ/NICとの接続にPCIeが必要。NVIDIAがPCIeを完全に排除すると、既存顧客の移行コストが増大し、市場競争力に影響を与える可能性がある。
  • ConnectX-9のPCIe依存:Rubinプラットフォームに含まれるConnectX-9(1,600Gbps)はPCIe Gen7 x16を前提とした設計の可能性があり、少なくともI/O Dieの一部でPCIeサポートが必要になる場合がある。
  • 設計の柔軟性:Vengineerのブログでは、PCIe Gen7の仕様変更に対応するため、I/O Dieを再設計するシナリオが想定されています。これにより、必要に応じてPCIeを追加する柔軟性が確保される可能性がある。

5. 結論と推測

現時点の情報に基づくと、NVIDIAのRubinおよびRubin UltraがPCIeインターフェイスを搭載しない可能性は高いものの、完全に排除されたと断定するには情報が不足しています。以下は推測を含めた結論です:

  • PCIe非搭載の可能性が高い理由:

    • NVLink v6/v7の高帯域幅とVera CPUとの統合により、PCIeの必要性が低下。
    • データセンター向けのNVL144/NVL576構成は、NVLinkを中心としたクローズドなエコシステムを志向。
    • Rubinのダイ設計(Compute Die + I/O Die)では、NVLink用のSerDesが優先され、PCIe用のスペースが制限される可能性。
    • X上の投稿で、ダイ画像がNVLink中心に見えると指摘されており、PCIeの物理的痕跡が確認されていない。
  • PCIe搭載の可能性が残る理由:

    • ConnectX-9や外部デバイスとの互換性確保のため、限定的なPCIeサポート(例:I/O Dieの一部でGen7 x16)が含まれる可能性。
    • PCIe Gen7の仕様策定(2025年予定)により、Rubinの量産タイミング(2025年後半~2026年)に間に合う場合、部分的なサポートが追加される可能性。
  • 最終推測:

    • NVIDIAはRubin/Rubin UltraでPCIeの役割を大幅に縮小し、NVLinkとVera CPUを活用した独自エコシステムを優先する可能性が高い。ただし、市場互換性やConnectX-9の要件を考慮し、I/O Dieの一部でPCIe Gen7をオプションとして残す可能性がある。PCIeが完全に非搭載の場合、NVIDIAx86依存からの脱却を加速し、AIデータセンター向けの専用プラットフォームを強化する戦略を取ると考えられる。

6. 今後の展望と確認方法

GTC 2025(2025年3月17~21日):NVIDIAの公式発表で、RubinおよびRubin Ultraの詳細な仕様(I/O構成、PCIeサポートの有無)が明らかになる可能性が高い。

  • サプライチェーン情報:TSMCの3nmプロセスやHBM4の量産状況、ConnectX-9のPCIe依存度に関する追加情報が、PCIe搭載の有無を判断する鍵となる。
  • コミュニティの議論:Xや技術ブログ(例:Vengineer)でのさらなる解析やリーク情報が、PCIe非搭載説を補強または反証する可能性がある。

7. 注意点

  • X上の投稿(@Vengineer)は信頼性のある技術者によるものですが、公式情報ではなく推測に依存しています。
  • Web検索結果はRubinの全体像をカバーしていますが、PCIeインターフェイスの有無に関する直接的な記述が少なく、間接的証拠に基づく推論が中心です。
  • NVIDIAの公式発表(特にGTC 2025)まで、PCIe非搭載説は仮説の域を出ません。

おわりに

上記のように、grok がまとめてくれました。

とりあえず、ブログやXに書いておいて、あとは、grok にまとめてもらうのは、いいんじゃないかと思うようになりました。