Vengineerの戯言

人生は短いけど、長いです。人生を楽しみましょう!

NVIDIA Grace Superchipの性能

はじめに

NVIDIAのGraceの発表があったのは、GTC2020春でした。

vengineer.hatenablog.com

あれから3年。そろそろ、Grace が出てきます。

今日のブログは、NVIDIAが公開した Grace CPU Superchip の ブログから。

NVIDIA Grace CPU Superchip

今回公開したのは、Grace CPU Superchipについてです。Grace CPUは、arm Neoverse-V2 x 72コア搭載で、Grace CPU Superchip は2つのGrace CPUをNVLink C2Cにて接続しています。

developer.nvidia.com

Grace Hopper Superchip に関しては既に公開済みで下記のWhitepaperに詳細があります。

resources.nvidia.com

下記の図は上記のブログにあるものです。説明のために引用します。

比較対象は、dual socket Milan 7763。Milan 7763は64コア/128スレッド、L3 Cacheは256MB(各dieでは32MB)。Milan-X ではないです。

Speed-upで 1.5倍以上、Energy saving で2.0倍以上改善です。

Grace の72コア、Milanの64コアでコア数だけでなく、チップ間の接続が NVLINK C2CとInfinity Fabricの転送帯域の大きな違いがものをいっているんじゃないですかね。1CPUでの比較もほしいところです。それから、メモリがLPDDR5で512GBですが500GB/sの帯域があります。Milanは204.8 GB/sの帯域なので2.5倍の性能差があります。上記の図にあるベンチマークのソフトウェアがメモリアクセスがどのくらいあるのかも気になります。

おわりに

Grace CPU Superchipベースのサーバー(たぶん 2Uのハーフ、2Uに2台の Grace CPU Superchipを搭載できる)を出してくると思うので、メモリが1TB(512GB + 512GB)でもOKなアプリケーションはいいソリューションになるんじゃないでしょうか?