Vengineerの妄想

人生を妄想しています。

NVIDIA DGX B300 NVL16 に、ConnectX-8 が搭載された理由を妄想する

はじめに

先週、DGX B300 について、ブログに残しました。

vengineer.hatenablog.com

この時、GPU Board に、PCIe Retimer ではなく、ConnectX-8 が搭載されていることを記録に残しました。

今回は、何故? ConnectX-8 を GPU Board に搭載したのかを 妄想します。

B300 の Package は、B200 の Package と違う

下記は、上記のブログにも引用したB300 Board の写真です。

GPU Packageの部分を見ると、2 die 間がかなり離れています。

下記の SemiAnalysis の資料によると、1 die の B200 は、B200A で CoWoS-L ではなく、CoWoS-S になっているようです。

semianalysis.com

B300でも同様に、1 die の B300 は、B300A で、CoWoS-S になっているので、2つの die 間にそれなりの間隔があるのだと思います。

PCIe

B300 の パッケージには、2つの B300A が搭載されていると考えると、PCIe が 2組出ていることになります。

しかしながら、Host Board からは x16 が 8組だけです。8個の B300 では、16組の x16 の PCIe が必要になります。

ConnectX-8

ConnectX-8 の PCIe は、Gen 6 で 48 lanes あります

DGX B300 NVL16 の GPU Board に ConnectX-8 を搭載すれば、x16をHost Boardとの接続、残りの 32 lanes を 16 lanes + 16 lanes にして、2つの B300A の PCIe に接続すればいい

おわりに

ConnecrX-8 から2組の x16 を B300 Package に論理的には接続できるが、配線ができるのでしょうか?

ということで、今回はここまでで、

次回も、Let's 妄想