Vengineerの妄想(準備期間)

人生は短いけど、長いです。人生を楽しみましょう!

NVIDIA Blackwell/RubinのCopy Engineを妄想する

はじめに

NVIDIAGPUには、Copy Engine (DMA)がいっぱい入っています。NVIDIAのCopy Engineについては、下記のブログにまとめています。

vengineer.hatenablog.com

Copy Engine

下記は、GP100 Pascal WhitePaper から説明のために引用します。

Copy Engine は、Crossbarに接続している HSHUB (High Speed Hub) に接続しています。

Blackwell の Copy Engine

下図がBlackwellの妄想図。H100までと同じと考えると、PCIe/NVLink がある場所に Copy Engine がありそう。

Blackwellの2 Dieを1つのGPUとして使うのであれば、これでOK。

しかしながら、Blackwellの2 Dieをそれぞれ違うGPUとして使う場合は、Die間のデータ移動をするCopy Engineが必要。PCIe/NVLink 側にある Copy Engine を使うというのもありだが、下図のように 2 Die の Crossbar 間の傍にCopy Engineを置く。

何でこんなことをするのかというと、推論などの2つのDieで動くプログラムを別にしたいケースなど。。。

Rubinはどうなるか?

Rubin では、Blackwell と同じ感じになるが、Rubin Ultra では下記のようになる。DMAが両側にある必要が無いが、どちらかには必要。

おわりに

Blackwell の 2 Die、Rubin Ultra の 3 Die では、今までと違う使い方もできるのかも?というのを妄想したのが今回の会であった。

では、今回はここまでで

次回も、Let's 妄想