Vengineerの戯言

人生は短いけど、長いです。人生を楽しみましょう!

NVIDIA GRACEの内部構成とArm V1/N2 Reference Designs を比べてみる

はじめに

NVIDA GRACEの内部構成がちょっと公開されたのがこれ(説明のために引用します)

これによると、CSN (Cache Switch Nodes) に、SCF Cache と Core が接続されていて、4方向の接続があるというもの

LPDDR5 x16 だと、32コアしか繋げられないので、残りの40コアは、10列x2 (10x2x2)で並んでいるのか?と妄想します。

追記)、2022.11.14 : ここ によると、LPDDR5X の チャネル数は32ということでした。

と書いた後に、いろいろと調べていたら、自分のブログに行きつきました。

vengineer.hatenablog.com

下記の写真から上段に(6 x 3) + (6 x 3)、下段に(6 x 4) + (6 x 4) のブロックが2次元に並んでいます。12 x 7 = 84。この内、8個はCPUコアではありません。76個のCPUコアになります。NVIDIAは72コアと言っているので、4コアはスペアですかね。

8個がメモリコントローラ部分になっています。NVIDIAが公開した図だとメモリコントローラは16個あるので、このブロックの中に2個のメモリコントローラに入っています。

L3 Cache が 117MB ということで、72コアだと、1024KB+512MBx72コア = 110,592MB で 6.4MB 違う。1024KB+512KBx76コアとすると、116,736MB となり、117MBというロジックですかね。

下記のツイートの画像が鮮明でした。

Arm V1/N2 Reference Designs

www.servethehome.com

の中にあった図を説明のために引用します。各Compute Tileには、CPUコア x 2 + System Level Cache であり、これが2次元に並んでいる。

下記も説明のために引用します。右上の System Level Cache と DRAM Controller が接続している感じ。

Memory System Resource Partitioning and Monitoring (MPAM), for A-profile architecture

Memory System Resource Partitioning and Monitoring (MPAM), for A-profile architecture

developer.arm.com

CMN-700 について、下記のブログに書きました。

vengineer.hatenablog.com

Memory System Resource Partitioning and Monitoring (MPAM) について、ちょこっと書いていますね。

おわりに

Arm CMN-700 が2021年4月頃の Arm Tech Day 2021 の発表なので、NVIDIA GRACE では使えないのかなと。そうなると、Arm CMN-600 になります。下図のように(説明のために下図を引用します)、内部接続は 8x8 となり、上記の妄想図では、8 + 10 + 10 + 8 はサポートしていないので、

  • NVIDIA fabric and distributed cahe design

というのは、そういうことなのかな?と思っています。