はじめに
Intel Habana Gaudi 3の詳細が出てきたことはこのブログでも紹介しました。
GPUを含めたAIアクセラレータ。第3世代目が勝負どころでは?と思っています。
第3世代を見てみる
- NVIDIA : P100 (16nm) => V100 (12nm) => A100 (7nm)
- AMD : MI100 (7nm) => MI200/MI210/MI250 (6nm) => MI300X (5nm/6nm)
- Intel Habana : Gaudi (16nm) => Gaudi 2 (7nm) => Gaudi 3 (5nm)
AI Cloud Chip Startup では、
- Cerebras Systems : CS-1 (16nm) => CS-2 (7nm) => CS-3 (5nm)
- SambaNova Systems : SN10 (7nm) => SN30 (7nm) => SN40L (5nm)
残念ながら、Graphcore は、第二世代までで終わりです。
- Graphcore : IPU MK1 (16nm) => IPU MK2 (7nm) = BoW IPU (7nm) これは、IPU MK2 の電源を強化したものなので第二世代
この中で、NVIDIAだけ、7nm 。AIアクセラレータと考えると、TensorCoreを入れたV100を第一世代とすると、
- NVIDIA : V100 (12nm) => A100 (7nm) => H100 (4nm)
となり、同じ感じなんでしょうかね。
想定外だった、SRAM
TSMCが 3nm では、5nm に対して、SRAMのサイズはあまり小さくならないよ、宣言によって、辛くなっている感じ。
となると、第4世代 (TSMC 3nm) では力業、つまり、いっぱい詰め込む、では無理そう。。ということで、5nm からは 2 die 以上で攻めている感じです。
そして、NVIDIAも H100までは 1die でしたが、B100では 2 die
おわりに
5nm ベースの AI アクセラレータが出そろいました。性能的には、NVIDIA H100/H200 程度にはなっているようです。となると、あとはお値段ですね。H100 の $30,000 に対して、AMD MI300X は $15,000 という話も出ているようなので、性能はほぼ同じで AIアクセラレータは半分。とは言え、1ボードで済むことがないので、Node単位だけでなく、Cluster単位でのお値段に比較が必要ですね。
基本、$1M を考えないといけないので、あたしの世界観ではもうすでに、どこかに行ってしまいました。。。。さようなら。