はじめに
NVIDIA RTX BLACKWELL GPU ARCHITECTURE というドキュメントが公開されたので、眺めてみました。
気になって点は、
- Advanced Power Gating
- RTX 5090 Specifications
ですね。
Advanced Power Gating
3つの Gating
- Clock Gating
- Power Gating
- Rail Gating
Clock Gating の図を拡大します。黄緑がSMへのクロック、水色がXBARのクロックですかね。
RTX 5090 Specification
GB202 は、12個の GPCs、各GPCには8個のTPCs、TPCの中には2個のSMが入っています。
RTX 5090では、
- GPCs : 11
- TPCs : 85 (GPCs 11 x 8 = 88 なので、一部のGPCは8個全部のTCPを使っているとは限らないようですね)。
GDDR7@30Gbps
GPU Boost Clock (MHz) は、2407MHz (RTX 4090は、2520MHz)
- L2 Cache : GB202は、128MB、5090は 96MB
RTX 5090 Specification
GB203 は、
- 7 GPCs
- 42 TPCs
- 84 SMs
- GDDR7@30 Gbps
で、そのまま、RTX 5080 に Specification になっています。
下記のXの投稿に、GB203 の die shot があります。
GB203-GPU blank and with some rough annotations. The die shot was shared by Tony from ASUS on Bilibili: https://t.co/kYTKDSBAWs pic.twitter.com/on0WGTRTEQ
— Andreas Schilling 🇺🇦 🇮🇱 (@aschilling) 2025年1月29日
GPCとTCPの数を数えてみたら、7 GPCs 、7 GPCs x 6 = 42 TPCs になっていました。
RTX 5070 Ti Specification
5070 Ti は、GB203のようですが、
- GPC : 6
- TPC : 35 (6 x 6 = 36)
- SM : 70
- GDDR7@28Gbps
です。
RTX 5070 Specification
GB205
- GPC : 5
- TCP : 25
- SM : 50
で、RTX 5070 は
- GPC : 5
- TPC : 24
- SM : 48
- GDDR7@28Gbps
おわりに
RTX Blackwell の die としては、
- GB202 : 5090
- GB203 : 5080 / 5070 Ti
- GB205 : 5070
がリリースされました。
GPCの中のTCPの数が違うんですね。てっきり、同じだと思っていました。。。