はじめに
GeForce 用GPUの die size を比べてみたいと思います。
GPU Specs Database から色々と比較してみました。
Turing、Ampere、Ada Lovelace
- Turing : TU102
- Ampere : GA102
- Ada Lovelace : AD102
がトップラインです。ざっくりな仕様です。
メモリが 384 bit の die
- TU102 : TSMC 12nm、SM (72)、GDDR6 (14Gbps)、die size (754 mm2)
- GA102 : TSMC 7nm、SM (84)、GDDR6X (19Gbps)、die size (628 mm2)
- AD102 : TSMC 5nm、SM (144)、GDDR??、die size (611 mm2)
die size、小さくなっていますね。
TU102 に対して、AD102は SM が倍になっているのに、die size が小さくなっていますね。
メモリが 256 bit の die
- TU104 : TSMC 12nm、SM (40)、545 mm2
- TU106 : TSMC 12nm、SM (36)、445 mm2
- GA103 : TSMC 7nm、SM (60)、496 mm2
- GA104 : TSMC 7nm、SM (48)、392 mm2
- AD103 : TSMC 5nm、SM (84)、380 mm2
こちらも、die size、小さくなっていますね
ちなみに、サーバー用
- GP100 : TSMC 16nm、SM (60)、610 mm2
- GV100 : TSMC 12nm、SW (84)、815 mm2
- GA100 : TSMC 7nm、SM (108)、826 mm2
- GH100 : TSMC 5nm、SM (144)、814 mm2
こちらは、GV100, GA100, GH100 は、それほどかわりませんね。レチクルの最大値 (26 mm x 33 mm = 858 mm2) に近い値ですね。
SM (84)が同じ
です。GV100 => GA100 で、0.77、GA102 => AD103 で、0.61 です。GV100 => AD103 では、0.47 です。
GA102 => AD103 では、0.77 です。プロセスは、7 / 12 = 0.58 です。プロセスの進化分は小さくなっていないですね。
一方、GA102 => AD103 では、プロセスは、5/7 = 0.71 です。それよりも小さくなっています。おまけに、GA102 の L2 Cache は、6MB ですが、AD103 の L2 Cache は 64MB です。なんでこんなに小さくなったのでしょうか?
おわりに
サーバー用の die size は、Voltaからそれほど変わっていませんが、GeForce では、Turing => Ampere => Ada Lovelace と die size が小さくなっていますね。