はじめに
NVIDIA GB10については、下記のブログで取り上げました。
今日は、GB10 の Grace (CPU chiplet)について、妄想したいと思います。
それでは、
Let's 妄想
Grace (CPU chiplet)
下記の図は、上記のCES2025のビデオから説明のために引用します。

Grace (CPU chiplet) は、Mediatek製です。
- CPU : Arm X925 x 10 + A725 x 10
ということですが、上記の図では
- Cluster-0 : X925 x 5 + A725 x 5
- Cluster-1 : X925 x 5 + A725 x 5
になっています。
X925/A725 は、Arm DSU-120 と一緒に使うようで、下記のような構成になっています。ここから説明のために引用します。

DSU-120 は、下記のような仕様になっているようです。3種類のCPU Typeが接続できるようです。たぶん、X4/A720/A520 とか X925/A725/A520 じゃないかな。
最大14コアまで接続可能なので、5+5 でもOKのようです。ただし、20コアは接続できないので、2つの Cluster に分けたのでしょうかね。

Arm CSS for Client の構成によると、下記のようになっています。

Arm CoreLinkシステムIPは、Arm CoreLink CI-700ベースっぽいです。
となると、
- CPU Cluster-0
- CPU Cluster-1
- DMC (LPDDR5X-0)
- DMC (LPDDR5X-1)
- I/O (PCIe : ConnectX-6?)
- その他のI/O (Wifi-7/BLE/GbE)
を CI-700 で接続する感じですかね。
Blackwell chiplet と Grace chiplet の接続は、下記のようにNVLink C2C になっています。

Blackwell (GPU chiplet)との接続は、CI-700 の CHIの複数のポートと接続しているんでしょうかね。
BlackwellからはUnified Memoryとして使うということは、ACE-Liteではなく、ACE(CPUと同じポート)に接続するんでしょうかね。
CI-700は、8 個までの DSUが接続できるので、2つのCPU Clusterを接続すると残りの6個のポートに GPUが接続する感じですかね。
それとも NVIDIA Graceのように、CMN-700を使っているのでしょうかね。
LPDDR5Xの性能
GB10のメモリ容量は、128GB、チップ数は8個なので、1個16GB(128Gb)
SamsungのLPDDR5Xのサイトによると、
- 128Gb、x64、8533Gbps
があります。
x64 x 8544Mbps x 8 = 546.112GB/s
これ、Grace Super Chip の LPDDR5X のDRAM性能と同じ。
となると、NVLINK-C2C も 同じで、片側450GB/s なんですかね。
512bit(64B)@ 1GHz で、64GB/s なので、7ポート必要になりますね。。。6ポートにすると、75GB/s となり、75/64 = 1.171875GHz で動かせはイイ感じですかね。
実際のところ、どうなんですかね。
おわりに
Grace (CPU chiplet)、Mediatekに開発してもらっているので、NVIDIAから NVLink C2Cの部分を提供していると思います。
- CI-700
- CMN-700
のどちらを使っているのかが気になります。
もしかしたら、この部分も NVIDIA から Mediatek へ提供しているのでしょうかね。
ここまでで、
次回も Let's 妄想
参考ブログ