Vengineerの妄想

人生を妄想しています。

Google TPU Ironwood (v7)のブロック図

はじめに

Hotchipにて、Google TPU Ironwood (v7) のブロック図が公開されたようです。

Xにそのブロック図が載っていたので記録に残します。

TPU の ブロック図は、v4/v4i 以来

TPU の ブロック図は、

  • v4/v4i

までです。v5e, v5p, v6e に関しては、公開されていません。

Ironwood は、2コアなので、v4 と比較します。

下記の v4 のブロック図は、 August 29, 2023 に公開された、ServeTheHome の

からの引用です。

Ironwood のブロック図

下記のXの投稿です。図を説明のために引用します。

上記の v4 との違いは、Ironwood は、Chiplet にて、Compute die x 2 + I/O die x 1 の構成になっています。

  • TensorCore の数は、同じで2つです。
    • ただし、TensorCore内のMXUの数は、4つから2つになっています。これは、MXUのサイズが128x128 => 256x256 になり、4倍の性能になったためです。
  • Sparse Core の数は、同じで4つです。
  • HBMのポートは4つ(2 Chip)から8つ(4 Chip)になっています。
  • PCIe Gen5 x16 は、I/O die ではなく、Compute die についています。2つの Compute die の内、1つのdie の PCIe I/F のみを使っているようです。
  • PCIe Gen2 x 1 を gBMC との接続に用意しています。

おわりに

v4 にあった、CMEMはどうなったんでしょうか。LLMのようなものでは、CMEM (Scratch Pad) って、効果がないのでしょうか?

誰か教えてください。

Norm Jouppi さんが発表されたんですね。

Sridhar Lakshmanamurthy san は、Linkedin によると、2020年8月に Intel から Join、NNP-I の開発に携わっていたエンジニアから、現在は Director Silicon のようです。

関連記事

www.servethehome.com