Vengineerの戯言

人生は短いけど、長いです。人生を楽しみましょう!

AMD EPYC x2 + NVIDIA HGX A100 の水冷システム

はじめに

AMD EPYC x2 + NVIDIA HGX A100 4-GPUs の水冷システム

videocardz.com

G262-ZL0

HGX A100 4-GPU をベースにしたシステム。PCIe Switch 2個で HGX A100 4-GPU で接続。各PCIe Switch に、2 x PCIe x 16 slots + NVMe x2 が繋がっています。

物理的には下記のようになっています。

  • CPU : EPYC x 2
  • HGX A100 4-GPU
  • PCIe Switch x 2
  • PCIe x16 x 4
  • 4 x 2.5" NVMe/SATA

G492-ZL2

HGX A100 8-GPU をベースにしたシステム。PCIe Switch 4個で HGX A100 8-GPU で接続。各PCIe Switch に、2 x PCIe x 16 slots + NVMe x1 が繋がっています。NVMe は各GPU毎ではなく、2個のGPUに対して1個 と 2個。

下記の写真から下段のGPU側に、

  • HGX A100 8-GPUs
  • PCIe Switch x4
  • PCIe x16 x 4
  • NVMe x 4

NVMe x 4 は、上段の 6 x 2.5" NVMe/SATA にケーブルで繋がっています。

おわりに

Ampare Altra Max ベースのNVIDIA A100サーバーのGPU側と似ていますね。

vengineer.hatenablog.com

並べてみたら、CPUボードだけ、替えたっぽですね。