Vengineerの妄想(準備期間)

人生は短いけど、長いです。人生を楽しみましょう!

AMD EPYC : Genoa、Genoa-X、Bergamo

はじめに

AMD が Bergamo を発表しました。

www.youtube.com

Bergamo

Bergamo は、Genoa と同じ IOD (I/O die) を使い、CCD には、zen4c x 16コア (L3 Cache : 16MB x 2) を8個搭載しています。

下記のツイートを説明のために引用します。このツイートでは、Bergamo の CCD のサイズを求めています。

  • zen4c : 10.4 mm x 7.2 mm = 74.88 mm2

zen4 CCD のサイズは、72 mm2 なのでちょっと大きい感じですね。

下記のツイートでは、Zen4 と Zen4c の比較の表が載っています。説明のために引用します。Zen4 と Zen4c の大きな違いは コア当たりのL3 Cache Size が半分ということです。

しかしながら、

www.semianalysis.com

では、Zen 4 CoreとZen 4c Core のレイアウト図が載っていて、Zen 4c Core は Zen 4 Core の半分ぐらいになっています。CCDに載っているL3 Cacheのサイズは、Zen 4 だと 32MB で、Zen 4c では 16MB x 2 なので、Coreの大きさは半分ぐらいにならないと同じぐらいのサイズにはならないと思います。

AMD EPYC 9004 Series Architecture Overview

AMD EPYC 9004 Series Architecture Overviewに、Genoa、Genoa-X、Bergamoの説明があります。

  • Genoa : 96コア、CCD-L3 Cache (32MB)
  • Genoa-X : 96コア、CCD-L3 Cache (32MB + 64MB)
  • Bergamo : 128コア、CCD-L3 Cache (16MB + 16MB)

CCDとIODを接続するための、GMI3 が IOD には12個あります。GMI3は36Gbpsで接続しているようです。1つのGMI3で1つのCCDを接続するのが Standard GMI links というようです。

下図を説明のために引用します。右側のGMI3-Wideというものは、GMI3 x 2 で1つのCCDを接続しています。その代わりに、IODに接続できるCCDの数は4個になってしまい、最大32コアになってしまいます。AMD EPYC 9334がGMI3-Wideのプロだくとのようです。何故か?スレッド数が32 x 2 = 64ではなく、56です。9454/9454P は 48コアで64スレッドです。

AMD EPYC™ 9004 SERIES PROCESSORSのProduct data sheet には、下記のように通常のEPYCの他に

  • AMD EPYC 9004 SERIES PROCESSORS WITH AMD 3D V-CACHE => Genoa-X
  • HIGH-FREQUENCY AMD EPYC 9004 SERIES PROCESSORS

というものがあるようです。HIGH-FREQUENCY というものは、コア数が少ないがその分動作週は数が10~15%速いようです。

IOD間を接続する xGMI ですが、ROME/Milanの時は PCIe Gen4 の 16Gbps に対して、ちょっと早い 18Gbpsでしたが、Genoa/Bergamoでは PCIe Gen5 と同じ 32Gbpsのようです。

おわりに

AMDは、zen 4 die, zen 4 die + Cache die, zen 4c die, I/O die の4種類の die を使って、プロダクトとしては、19種類をアナウンスしています(XXXS、XXXPを含めると、24種類)。

ROME、Milan、Milan-Xから、Genoa、Genoa-X、Bergamoに移行していくようですが、次はどうなるんでしょうかね。IODにもうこれ以上メモリを接続するのは難しそうですが、何か?作戦はあるんでしょうかね。