はじめに
Tenstorrentは、あたしが今、一番気にしている会社です。
このブログでは下記のように11回も Tenstorrent を取り上げています。
- TenstorrentのAIコアは、SynopsysのARCベース?(2022/07/31)
- Tenstorrentのコンパイラ技術、RESPAPE/TRANSPOSE/SQUEEZEをデータ移動に押し込む(2020/12/16)
- 話題の Jim Keller さんが President and CTO, with a seat on the board になった 会社、Tenstorrent のチップってどんな感じ?(2021/01/09)
- Jim Keller さんへのインタビュー記事を読んで(2021/05/31)
- Tenstorrent、2021:Wormhole (12nm)、2022:Blackhole (7nm)、2023:Grendel (4nm)(2021/12/02)
- Tenstorrent もクラウドサービスを始めたっぽい (2021/12/14)
- Tenstorrentの戦略は、複数のAIモデルをシステム内に入れちゃうっていうこと! (2022/01/24)
- Tenstorrent の Black Hole (6nm)、Grendel (4nm) (2022/03/24)
- TenstorrentのOcelot: The Berkeley Out-of-Order RISC-V Processor with Vector Support (2022/10/25)
- TenstorrentのAEGIS RISC-V CPU chipletは、128コア(2022/01/10)
- Tenstorrent、Jim Keller san が CEO に!
その Tenstorrent の ML Computer戦略である Black hole と Grendel の情報がアップデートされました。
Black hole と Grendel は chiplet
下記のインタビュー記事に色々な情報がありました。
下記の図を説明のために引用します。
Black hole には、Die to Die が付いていて、RISC-V chiplet と接続して、Grendel になるようです。RISC-V chiplet には、LPDDR5 chiplet が2つ付き、1つのchipletには 4 channel の LPDDR5 が付く。
- RISC-V chiplet には、128コア ( 32コア x 4クラスタ )
- LPDDR5 は 6400Mbps x 64bit なので、51.2GB/s。8 channel で 409.6GB/s
- 各クラスタ当たり、32コアでLPDDR5 x 2 channel = 102.4GB/s
- D2D 間帯域は、2TB/s : (512GB/s x 双方向) x 2、512GB/s は UCIe Advanced Package は 4Tbps (512GB/s)相当
- LPDDR5 x 4 channel は 51.2GB/s x 4 = 204.8GB。RISC-V chiplet <=> LPDDR5 chiplet の D2D 間帯域は 256GB/s あればOK
Black hole は 6nm、RISC-V chiplet は 3nm、LPDDR5 chiplet は Black hole の LPDDR5 部を切り出せばいいので 6nm でOK! Black hole と LPDDR5 chiplet を同じ6nm で作れば、RISC-V chiplet との接続確認はちょっと楽になる?
おわりに
上記のインタビューによると、Jim Keller san はエンジェル投資家だった模様。ということは、どこかの時点で、ML Accelerator => ML Computer になったのは自明だったのかな?と思いました。
まだまだ、妄想力が足りません。。。。