はじめに
先週、DGX B300 について、ブログに残しました。
この時、GPU Board に、PCIe Retimer ではなく、ConnectX-8 が搭載されていることを記録に残しました。
今回は、何故? ConnectX-8 を GPU Board に搭載したのかを 妄想します。
B300 の Package は、B200 の Package と違う
下記は、上記のブログにも引用したB300 Board の写真です。
GPU Packageの部分を見ると、2 die 間がかなり離れています。
下記の SemiAnalysis の資料によると、1 die の B200 は、B200A で CoWoS-L ではなく、CoWoS-S になっているようです。
B300でも同様に、1 die の B300 は、B300A で、CoWoS-S になっているので、2つの die 間にそれなりの間隔があるのだと思います。
PCIe
B300 の パッケージには、2つの B300A が搭載されていると考えると、PCIe が 2組出ていることになります。
しかしながら、Host Board からは x16 が 8組だけです。8個の B300 では、16組の x16 の PCIe が必要になります。
ConnectX-8
ConnectX-8 の PCIe は、Gen 6 で 48 lanes あります。
DGX B300 NVL16 の GPU Board に ConnectX-8 を搭載すれば、x16をHost Boardとの接続、残りの 32 lanes を 16 lanes + 16 lanes にして、2つの B300A の PCIe に接続すればいい
おわりに
ConnecrX-8 から2組の x16 を B300 Package に論理的には接続できるが、配線ができるのでしょうか?
ということで、今回はここまでで、
次回も、Let's 妄想