はじめに
HotChips 2024の講演模様がYoutubeにアップされました。
の中に、Tenstorrent の Blackhole Galaxy の説明がありましたので、記録に残します。
Tenstorrent の Blackhole Galaxy
ビデオの 13:48 頃から
下記の図は、上記のビデオから説明のために引用します。
まずは、Ethernet-Based Scale out というスライド
- 200GB/s が 4組出ていて、2D/3D torus 構成が可能
- 32 chips in a 5x32 Mesh
- X dim I/O : 8 x 200 GB/s
- Y dim I/O : 16 x 200 GB/s
- Z dim I/O : 32 x 200 GB/s
- AI compute : 24 PFLOPs
- AI memory : 16 TB/s BW, 1TB capacity
- AI switch : 11.2 TB/s I/O
おわりに
Tenstorrent の Blackhole Galaxy と 下記のCerebras Systems の CS-X + SwarmX + MemoryX のシステム、どちらが強いのでしょうかね。