はじめに
今朝、AMD CNDA3のWhite Paperが公開されたのを知りました。
実際には、8日前に公開されていたようです。え、MI300A/MI300X発表の時に公開されたのか?
CDNA/CDNA2 の White Paper も公開されています。
AMD CDNA 3 ARCHITECTURE
下図は上記のAMD CDNA 3 ARCHITECTUREから説明のために引用します。
MI300XとMI250Xとの性能比較です
- Matrix FP64 : 1.7x
- Vector FP64 : 1.7x
- Matrix FP32 : 1.7x
- Vector FP32 : 3.4x
- Matrix FP16/BF16 : 3.4x
- Matrix FP8 : 新規サポート
- Matrix INT8 : 6.8x
MI300XのCUは、304(308)、MI250XのCUは、220(224)なので、304/220 = 1.38倍です。1.7/1.38 = 1.23倍ぐらい動作周波数が上がっていると思います。
MI250Xの動作周波数は、1700MHzということなので、1700MHz x 1.23 = 2094MHzぐらいで動作するようですね。
2,100 MHz のようですね。
下記はメモリ周りです。
HBM3とIOD間は、5.3TB/s (5.3Tx8/8/1024 = 5.175Gbps. ドキュメントにも、5.2Gbpsとあります。
MI300AのGPUの分割について、
- Single Partition : XCD x 6
- Triple Partition : (XCD x 2) x 3
MI300Xの仮想化による分割
- Single Partition : XCD x 8
- Two Partitions : (XCD x 4) x 2
- Four Partitions : (XCD x 2) x 4
- Eight Partitions : (XCD x 1) x 8
MI300X x 8 + EPYC x 2 の構成
MI300A x 4 の構成
Infinity Fabricは各パッケージから6組(実際は7組ある) と PCIe Gen5 x16 . Infinity Fabric は、PCIe Gen5 x16 と同等の 64GB/s (片方向)
おわりに
の比較をして、CDNA 4 を妄想してみたいです。
関連ブログ