Vengineerの妄想

人生を妄想しています。

NVIDIA GB10のGrace(CPU chiplet)

はじめに

NVIDIA GB10については、下記のブログで取り上げました。

vengineer.hatenablog.com

今日は、GB10 の Grace (CPU chiplet)について、妄想したいと思います。

それでは、

Let's 妄想

Grace (CPU chiplet)

www.youtube.com

下記の図は、上記のCES2025のビデオから説明のために引用します。

Grace (CPU chiplet) は、Mediatek製です。

  • CPU : Arm X925 x 10 + A725 x 10

ということですが、上記の図では

  • Cluster-0 : X925 x 5 + A725 x 5
  • Cluster-1 : X925 x 5 + A725 x 5

になっています。

X925/A725 は、Arm DSU-120 と一緒に使うようで、下記のような構成になっています。ここから説明のために引用します。

DSU-120 は、下記のような仕様になっているようです。3種類のCPU Typeが接続できるようです。たぶん、X4/A720/A520 とか X925/A725/A520 じゃないかな。

最大14コアまで接続可能なので、5+5 でもOKのようです。ただし、20コアは接続できないので、2つの Cluster に分けたのでしょうかね。

Arm CSS for Client の構成によると、下記のようになっています。

Arm CoreLinkシステムIPは、Arm CoreLink CI-700ベースっぽいです。

となると、

  • CPU Cluster-0
  • CPU Cluster-1
  • DMC (LPDDR5X-0)
  • DMC (LPDDR5X-1)
  • I/O (PCIe : ConnectX-6?)
  • その他のI/O (Wifi-7/BLE/GbE)

を CI-700 で接続する感じですかね。

Blackwell chiplet と Grace chiplet の接続は、下記のようにNVLink C2C になっています。

Blackwell (GPU chiplet)との接続は、CI-700 の CHIの複数のポートと接続しているんでしょうかね。

BlackwellからはUnified Memoryとして使うということは、ACE-Liteではなく、ACE(CPUと同じポート)に接続するんでしょうかね。

CI-700は、8 個までの DSUが接続できるので、2つのCPU Clusterを接続すると残りの6個のポートに GPUが接続する感じですかね。

それとも NVIDIA Graceのように、CMN-700を使っているのでしょうかね。

LPDDR5Xの性能

GB10のメモリ容量は、128GB、チップ数は8個なので、1個16GB(128Gb)

SamsungのLPDDR5Xのサイトによると、

  • 128Gb、x64、8533Gbps

があります。

x64 x 8544Mbps x 8 = 546.112GB/s

これ、Grace Super Chip の LPDDR5X のDRAM性能と同じ。

となると、NVLINK-C2C も 同じで、片側450GB/s なんですかね。

512bit(64B)@ 1GHz で、64GB/s なので、7ポート必要になりますね。。。6ポートにすると、75GB/s となり、75/64 = 1.171875GHz で動かせはイイ感じですかね。

実際のところ、どうなんですかね。

おわりに

Grace (CPU chiplet)、Mediatekに開発してもらっているので、NVIDIAから NVLink C2Cの部分を提供していると思います。

  • CI-700
  • CMN-700

のどちらを使っているのかが気になります。

もしかしたら、この部分も NVIDIA から Mediatek へ提供しているのでしょうかね。

ここまでで、

次回も Let's 妄想

参考ブログ

www.anandtech.com