Vengineerの妄想(準備期間)

人生は短いけど、長いです。人生を楽しみましょう!

AMD CDNA3 White Paper

はじめに

今朝、AMD CNDA3のWhite Paperが公開されたのを知りました。

実際には、8日前に公開されていたようです。え、MI300A/MI300X発表の時に公開されたのか?

CDNA/CDNA2 の White Paper も公開されています。

AMD CDNA 3 ARCHITECTURE

下図は上記のAMD CDNA 3 ARCHITECTUREから説明のために引用します。

MI300XとMI250Xとの性能比較です

  • Matrix FP64 : 1.7x
  • Vector FP64 : 1.7x
  • Matrix FP32 : 1.7x
  • Vector FP32 : 3.4x
  • Matrix FP16/BF16 : 3.4x
  • Matrix FP8 : 新規サポート
  • Matrix INT8 : 6.8x

MI300XのCUは、304(308)、MI250XのCUは、220(224)なので、304/220 = 1.38倍です。1.7/1.38 = 1.23倍ぐらい動作周波数が上がっていると思います。

MI250Xの動作周波数は、1700MHzということなので、1700MHz x 1.23 = 2094MHzぐらいで動作するようですね。

2,100 MHz のようですね。

下記はメモリ周りです。

HBM3とIOD間は、5.3TB/s (5.3Tx8/8/1024 = 5.175Gbps. ドキュメントにも、5.2Gbpsとあります。

MI300AのGPUの分割について、

  • Single Partition : XCD x 6
  • Triple Partition : (XCD x 2) x 3

MI300Xの仮想化による分割

  • Single Partition : XCD x 8
  • Two Partitions : (XCD x 4) x 2
  • Four Partitions : (XCD x 2) x 4
  • Eight Partitions : (XCD x 1) x 8

MI300X x 8 + EPYC x 2 の構成

MI300A x 4 の構成

Infinity Fabricは各パッケージから6組(実際は7組ある) と PCIe Gen5 x16 . Infinity Fabric は、PCIe Gen5 x16 と同等の 64GB/s (片方向)

おわりに

の比較をして、CDNA 4 を妄想してみたいです。

関連ブログ

vengineer.hatenablog.com