Vengineerの妄想(準備期間)

人生は短いけど、長いです。人生を楽しみましょう!

AMD MI250X と MI300X のアーキテクチャの比較

はじめに

昨日の

vengineer.hatenablog.com

は、あたしが調べて、MI300A/MI300XとMI250Xを比較したのですが、

今日は、下記の記事の中を見ていきます。 この記事では、AMD CDNA3 ARCHITECURE (MI300X)と MI250X、NVIDIA H100、Intel Ponte Vecchioと比較しています。

chipsandcheese.com

下記に紹介する図は、上記の記事から説明のために引用します。

AMD CDNA3 ARCHITECTURE

まずは、CDNA3(MI300X)の構成です。L2 Cache は、XCDにあります。256KB x 16 = 4MB です。Infinity Cacheは、IODにあり、(2MB x 16 ) x 2 = 64MBです。 Infinity Cacheは、HBM3 Memory Controller の各チャンネルに割り当てている感じです。HBM3 Memory Controller は、8B/cycle でアクセスしているので、8 x 8 = 64bit、1024bit/64bit = 16チャンネルになっています。IODには、2つの HBM3 Memory が付いているので、32個のHBM3 Memory Controllerとなるわけです。

AMD CDNA2 ARCHITECTURE

下図は、CDNA2(MI250X)の構成です。

L2 Cache は、32 slice でそれが HBM2e Memory Controller に接続しています。32 x 256KB なので、L2 Cacheは8MBです。16B/cycleなので、16 x 8 = 128bit。1024bit / 128bit = 8 チャネル。MI250X の 1die には、4つのHBM2e が付いているので、8 チャネル x 4 = 32 チャネルで、L2 CacheのSlice数と同じです。

おわりに

L2 Cache

  • MI250X : 256KB x 32 = 8MB
  • MI300X : 256KB x 16 x 8 = 4MB x 8 = 32MB

Infinity Cache

  • MI250X : 0
  • MI300X : (2MB x 16) x 4 = 64MB x 4 = 256MB

という構成のようです。