はじめに
下記の投稿がXに流れてきました。説明のために引用します。
As I mentioned before, GA100 is 8*8, and GH100 is 8*9. GB100 will have a basic structure like 8*10. GB202 looks like 12*8.
— kopite7kimi (@kopite7kimi) 2023年9月28日
GB100 は、640 SMs
- GA100 is 8*8
- GH100 is 8*9
- GB100 will have a basic structure like 8*10
- GB202 looks like 12*8
ということで、GB100のSMの数は、8 x 10 x 8 = 640 ということに。
GH100の 576に対して、11.1% 増です。GA100 の 512 => GH100 の 574 の 12.5% 増にはいたっていませんが、それなりに増えています。
A100 => H100 では、
- SM数増で 1.2 倍
- New Tensor Core で、2倍
- Increased Frequency で、1.3倍
= 1.2 x 2 x 1.3 = 3.12 倍になりました。
GH100 => GB100 でも、Tensor Coreが新しくなって、2倍の性能になれば、1.11 x 2 = 2.22 倍まではいきそうです。
一方、上記の投稿のスレッドの中で、HBMのビット幅が 8192bit ということで、GA100/GH100の 6 x HBM から GB100 では 8 x HBM になるようです。 説明のために投稿を引用します。
GB100 8192-bit, GB202 512-bit.
— kopite7kimi (@kopite7kimi) 2023年9月28日
8個のHBMになると、1つの die では接続できないのでは?となると、AMD MI250のような 2 dies 構成 または、AMD MI300X(MI300) のような 4 dies (8 dies) になるんでしょうかね。
それとも、下記のブログにも書きましたが、L3 Cache die を導入するのでしょうかね。
おわりに
GB100、どうやら、2024年後半に出てくるようです。となると、発表は GTC2024の春になるんでしょうかね。