Vengineerの妄想(準備期間)

人生は短いけど、長いです。人生を楽しみましょう!

Tenstorrent の LLM solution

はじめに

いつものように Youtube を散歩していたら、Tenstorrent の AI Hardware Summit 2023 のビデオがアップされているのを見つけました。

こちら。

このビデオで、Tenstorrent の LLM Solution についての説明がありました。以下の画像は、上記のビデオから説明のために引用します。

Tenstorrent の LLM Solution とは、

Galaxy とは、Wormhole という GF12nm で開発したチップを 32個搭載したシステムです。

Tenstorrent の LLM Solution は、Galaxy にて LLM に対応するというものです。1つの LLM Layer を 1個の Wormhole に割り当てるというものです。上記の図では、22 Layers の LLM モデルを 22個の Wormhole で実行するというものです。Wormhole 間は 数本の100GbEで接続しています。

下記には、Wormhole を2個載せた PCIe Card を8枚載せたボード(真ん中)を8枚載せたサーバー(下)を2個積んで(上)、2 x 8 x 2 = 32個の Wormhole で Galaxy になるわけです。

Galaxy

2023年6月のマイナビの下記の記事には、Galaxy の写真が載っています。

Galaxy が載っているスライドを説明のために下記に引用します。左から2番目に 4U の中に32枚のボードが入ったものが Galaxy ということでした。

おわりに

出も下記のように(説明のために引用します)、32枚のボードが入ったものが Galaxy になっています。

どちらなんでしょうかね。

追記)、2023.11.14

SC23にて、Galaxy が展示されているようです。

上記のスライドの中のGalaxyと同じっぽいです。

表側同士/裏側同士を4本のケーブルで接続するようです。HOSTと書いてあるところはどうなるのでしょうかね。