Vengineerの妄想

人生を妄想しています。

AMD MI300A/MI300X

はじめに

AMDがMI300A/MI300Xの詳細を公開しました。

www.youtube.com

MI300A

  • 6 x XCD (38 CUs)
  • 3 x CCD (8 Zen4)
  • 4 x IOD
  • 8 x HBM3 (128GB/8H)
  • 256MB Infinity Cache
  • 3.5D packaging

GPU die に関して

  • GPU Architecture : CDNA3
  • Lithography : TSMC 5nm | 6nm FinFET
  • Stream Processors : 14,592
  • Compute Units : 228
  • Peak Engine Clock : 2100 MHz
  • Peak Half Precision (FP16) : 980.6 TFLOPs
  • Peak Single Precision Matrix (FP32) : 122.6 TFLOPs
  • Peak Double Precision Matrix (FP64) : 122.6 TFLOPs
  • Peak Single Precision (FP32) : 122.6 TFLOPs
  • Peak Double Precision (FP64) : 61.3 TFLOPs
  • Peak INT8 : 1.96 POPs
  • Peak bfloat16 : 980.6 TFLOPs

MI300X

  • 8 x XCD (38 CUs)
  • 4 x IOD
  • 8 x HBM3 (192GB/12H)
  • 256MB Infinity Cache
  • 3.5D packaging

性能比較

NVIDIA H100とMI300Aの比較です。MI300Xではありません。AI性能だけでなく、HPC性能がすごいよというのがAMDの主張ですね。

ノード構成

下記は、AMD MI300AのData sheetからの引用です。MI300A x 4 が node 単位です。

HPE Cray の Blade になると、PCIe Gen5 のところに、Slingshot が付く感じですかね。

下記は、GIGABYTEのサーバー機の写真です。ここから説明のために引用します。

こちらの写真では、サーバー全体が映っています。ここから説明のために引用します。

MI300X では、下記のように NVIDIA HGX H100 のような感じですね。ここから説明のために引用します。

おわりに

AMDI MI300A/MI300X の情報を集めてみると、

の silicon die と非常に似ているような気がしました。

参考のために、

vengineer.hatenablog.com

関連記事

www.servethehome.com