Vengineerの妄想

人生を妄想しています。

NVIDIA NVLとは?

はじめに

NVIDIAがBlackwellを出してから、NVLxx というのを頻繁に使うようになっています。

  • GB200 NVL72
  • GB200 NVL2
  • GB200 NVL4

とか?

GTC2025のkeynote にて、この NVL についての説明がありましたので、記録に残します。

NVL

Blackwell は、1パッケージの中に2つの reticle size な GPU die が載っているということです。つまり、1 recticle size die が 1GPU

Blackwell Ultra は、Blackwell と同様に 1パッケージの中に 2 die が載っているので、2 GPU です。

Rubin も同様に、1パッケージの中に、2 die (compute die) が載っているので、2 GPU です。

Rubin Ultra は、1パッケージの中に、4 die (compute die) が載っているので、4 GPU です。

GB200 NVL72 は、2個のGrace と 4個のBlackwellが載った1Uサーバーを18枚搭載しているので、4 x 18 = 72 個の Blackwell のパッケージが載っています。GB300 NVL72 も同様です。

で、Rubin からは、呼び方が変わり、パッケージではなく、GPUの数を1とします。なので、Rubin NVL144は、1Uのサーバーに 2個のVeraと4個のRubinが搭載され、それが18枚搭載されているRackになります。GPU の数は、2 x 4 x 18 = 144 です。なので、Rubin NVL144 になります。

Rubin Ultra NVL576 では、Rubin Ultra が 4 GPU なので、1Uに2個のVeraと2個のRubin Ultraを搭載し、その1Uを 18 x 4 = 72枚、Rackに収めるということになります。 したがって、GPUの数は 4 x 2 x 72 = 576個。なので、Rubin Ultra NVL576 となります。

おわりに

非常に分かりずらいです。

Rubin からだと思ったら、HGX B300 NVL16 とかもあるようなので、なんか、ごちゃごちゃです。

www.nvidia.com