はじめに
下記のXの投稿に、NVIDIAのGB200をベースにしたシステムの構成について載っていましたの、記録に残します。
Nvidia停止GB200 NVL36*2 (72GPU雙櫃版 ) 開發;AI與Nvidia長期趨勢仍正向,但產品規劃頻繁改變恐讓短期交易氣氛降溫https://t.co/9l1UBSAQrl
— 郭明錤 (Ming-Chi Kuo) (@mingchikuo) 2024年10月1日
3つのシステム構成
GB200を使ったシステムとしては、
- GB200 NV72
- GB200 NV36*2
- GB200 NB36
の3つがあるようです。
記事によるか開発リソースの関係から、NV72 に集中し、NV36の開発を中止すると
GB200 NV72って、下記のようなラックですね。1Uサーバーの数を数えると、18台です。なので、1つのラックには 18 x 2 = 36個のGB200が載っています。GB200は、1個のGraceと2個のBlackwellの構成なので、Blackwelの総数は、18 x 2 x 2 = 72 となり、NVL72 になります。
NV36って、このラックの半分なので、高さ方向に短くなっているってことですよね。最小構成として、NV36を用意するのはOKだと思うのですが、需要としては10万個とか言っているので、NV36よりNV72の方がいいでしょうね。。。
おわりに
NV72に集中することで、開発費の削減になりますね。これで益々、儲かりそうです。。。
追記)、2024.10.08
によると、
The first phase is expected to be operational by mid-2025. Full deployment is targeted for 2026.
ということで、まだまだ、先の模様。。
追記)、2024.10.09 Microsoft Azure な GB200 NVL72。計算機に1ラック、冷却に2ラック
NVIDIA "Blackwell" GB200 Server Dedicates Two-Thirds of Space to Cooling at Microsoft Azure https://t.co/T1bQn6kbFK pic.twitter.com/uVRJxnOheJ
— TechPowerUp (@TechPowerUp) 2024年10月9日