はじめに
XにNVIDIA GH200が動いているっポイ投稿がありましたので、記録のために残します。
lspci
下記の投稿では、lspci のログが載っています。
NVIDIA Grace lscpu pic.twitter.com/AY65anQm1C
— Longhorn (@never_released) 2023年11月10日
記録のために画像を引用します。72コアで最大周波数 3429MHzで動いているのがわかります。NUMAノードが9個で、ノード0に72個のCPUがあることが分かります。
下記の投稿では、各ノードのメモリ容量が分かります。
NUMA node 0: CPU mem
— Longhorn (@never_released) 2023年11月10日
Node 1: gpu pic.twitter.com/drvWV25Udm
記録のために画像を引用します。ノード0に480GB、ノード1に96GBのメモリがあります。ノード0が CPUであるGrace、ノード1がGPUであるHopperになると思うのですが、ノード2から8まではなんなのでしょうかね。。
おわりに
GH200の性能って、どのくらいなんでしょうかね。。。
H100 => Grace へのメモリにアクセスした時の性能を知りたいですね。
GH200- The latest AI supercomputer from Nvidia
— Bindu Reddy (@bindureddy) 2023年11月9日
This is a giant leap forward from the H100 and is 3-7x more performant for training and deploying AI models that use terabytes of data.
With 144 Terabytes of shared memory and 141 GB HBM3e memory. The shared memory is 500 times… pic.twitter.com/FcHbob4Jn2
上記の投稿の内容、微妙に違いますね。
With 144 Terabytes of shared memory and 141 GB HBM3e memory.
144 TBは1個のGraceではなく、DGH GH200の最大構成の 256台のGH200が接続した時の全体の容量 今出ているGH200のGPU側のメモリは、96GB。141GBは HBM3eになった場合。
900GBps
片側 460GB/s x 2 = 900GB/s