はじめに
NVIDIAは、GPU の Kenel module をオープンソースにするという発表を行っています。対象は、R560からです。
ということで、github に、R560 が落ちてきたので見てみました
GB100/GB102
NVIDIAのopen-gpu-kernel-modulesに
— Vengineerの妄想 (@Vengineer) 2024年7月30日
Blackwell GB10X登場https://t.co/ccvQAHtKCn pic.twitter.com/ZqOGVejCxE
GB100だけど、GB102 https://t.co/XkhtdHGS1d pic.twitter.com/uLVYv0VTzB
— Vengineerの妄想 (@Vengineer) 2024年7月30日
HSHUBS
— Vengineerの妄想 (@Vengineer) 2024年7月30日
Hopper : 5
Blackwell : 12 (6 x 2) pic.twitter.com/LVylPpjjlf
Copy Engine
Hopper の Copy Engine は、10 でした。
Blackwell の Copy Engine は、10 x 2 = 20 のようです。
Blackwell : Copy Engine 10 x 2
— Vengineerの妄想 (@Vengineer) 2024年7月30日
Hopper : Copy Engine 10 x 1https://t.co/j8a2BZQffK
Blackwellは、2 die なので、1 die では、Copy Engine は 10 です。
となると、この部分は同じなんでしょうか?
ここによると、Hopperでは、
#define NV_CE_MAX_HSHUBS 5
でしたが、Blackwell には、このマクロは無いです。
おわりに
GB100 と GB102 の関係は、
- GB102 x 2 == GB100
のようです。
AmpereのGA102は デスクトップ用のGPUでしたが、Blackwell の場合は、1 die が GB102, 2die が GB100 になるでしょうかね。
下記のように、Chip Firmware のバージョンが Hopper の 6 から Blackwell の 8 になっています。7 は GTX 50x0 になるのでしょうかね。
GTX 50x0 (7) の部分が抜けている? pic.twitter.com/E0kQPZGJnI
— Vengineerの妄想 (@Vengineer) 2024年7月30日
GB100だけでなく、GB102が居るのは、下記の semianalysis の記事にあるように、GB200A があるからかな?どうなんだろうか? (この記事は、PAIDになっているので、読めなくなっている可能性はあります)
GB200Aに関しては、下記の記事にもあります。
関連ブログ