はじめに
AMD EPYC x2 + NVIDIA HGX A100 4-GPUs の水冷システム
G262-ZL0
HGX A100 4-GPU をベースにしたシステム。PCIe Switch 2個で HGX A100 4-GPU で接続。各PCIe Switch に、2 x PCIe x 16 slots + NVMe x2 が繋がっています。
物理的には下記のようになっています。
G492-ZL2
HGX A100 8-GPU をベースにしたシステム。PCIe Switch 4個で HGX A100 8-GPU で接続。各PCIe Switch に、2 x PCIe x 16 slots + NVMe x1 が繋がっています。NVMe は各GPU毎ではなく、2個のGPUに対して1個 と 2個。
下記の写真から下段のGPU側に、
- HGX A100 8-GPUs
- PCIe Switch x4
- PCIe x16 x 4
- NVMe x 4
NVMe x 4 は、上段の 6 x 2.5" NVMe/SATA にケーブルで繋がっています。
おわりに
Ampare Altra Max ベースのNVIDIA A100サーバーのGPU側と似ていますね。
並べてみたら、CPUボードだけ、替えたっぽですね。