Vengineerの妄想(準備期間)

人生は短いけど、長いです。人生を楽しみましょう!

Google TPUは、HBM2

はじめに

調べ物をしていて、今更ながら気が付きました。Google TPU v2/v3/v4i/v4 は、HBM2 (HBM2e) ではない。

v2/v3 は、TSMC 16nm で開発。v4i/v4 は TSMC 7nm で開発。

振り返り

v2/v3/v4i のHBMの帯域は、「Ten Lessons From Three Generations Shaped Google’s TPUv4i」の論文(Table 1.)にて、下記のようになっています。説明のために引用します。

v4 については、TPU v4: An Optically Reconfigurable Supercomputer for Machine Learning with Hardware Support for Embeddingsの論文(Table 4.)にて、下記のようになっています。説明のために引用します。

  • v2 : 700GB/s => 4個なので、1つは175GB/s、175 x 8 / 1024bit = 1.367Gbps
  • v3 : 900GB/s => 4個なので、1つは225GB/s、225 x 8 / 1024bit = 1.757Gbps
  • v4i : 614GB/s => 2個なので、1つは307GB/s、307 x 8 / 1024bit = 2.398Gbps
  • v4 : 1200GB/s => 4個なので、1つは300GB/s、300 x 8 / 1024bit = 2.343Gbps

多少、クロックが上がっています。v2 => v3 で 30% up、v3 => v4i/v4 で 33% up

SamsungのHBM2の仕様を見ると、

  • 2.0 Gbps
  • 2.4 Gbps

があるので、

おわりに

てっきり、TSMC 7nm で開発した v4i/v4 は HBM2e だと思っていましたが、HBM2 でした。v2/v3/v4iv4 の HBM周りの大きな変更をすることがなかったので、HBM2のままだったんでしょうか?