はじめに
Huawei Ascend 910C が H100 を超える性能という情報が流れてきました。
今回は、Hauwei Ascend 910シリーズについて、見ていきます。
Ascend 910
Ascend 910 についても、このブログでも2019年9月6日に取り上げています。継続は力なりです。
NVIDIA A100の発表が 2020年5月なので、9か月も前です。
共に、TSMC 7+nm (EUV) で開発しています。
性能は、
- Ascend 910 : 256 TFLOPS(FP16), 512 TOPS(INT8)
- A100 : 312 TFLOPS(FP16/BF16), 624 TFLOPS(INT8)
でした。
Ascend 910B
2023年10月の時点で、下記の記事によるとAscend 910B というものがあって、A100と基本的には同等の性能に達したとあります。
当初は、A100 より 18%遅いとなっていたが、たぶん、ソフトウェアのチューニング等で頑張ったのだと思います。
また、下記の Trendforce の記事によると、910B は、SMICの N+2 プロセスで開発したとあります。
SMIC N+2 process とは、下記の記事によると、SMIC 7nm のようです。Huawei Mate 60 Pro の SoC でも使われています。
Ascend 910C
そして、Ascend 910C は、下記の記事によると、H100に匹敵すると顧客候補に宣伝しているようです。
Ascend 910 の構成
では、Ascend 910の構成ってどうなっているの?
下記の後藤さんのPC Watchの記事は、Hot Chips 31 (2019) の時のものでここに Ascend 910 の構成が分かるものが載っています。
説明のためにAscend 910 Die Shotの図を引用します。A100は 1 Die + HBM2e x 6 でしたが、Ascend 910は、2 Die + HBM2 x 4 です。マルチダイという点では、Ascend 910の方が先にいっていたんですね。
パッケージの中には、
- Virtuvian Die
- Nimbus Die
- HBM2 x 4
- Dummu DIe x 2
の構成になっています。
910B/910C が910をベースにしていると考えると、計算機の部分に対応する Virtuvian Die を作り直す感じでは?と思っています。
Nimbus DIe の方を変えると、システム全体を作り直す必要が出てしまうためです。
下図は、Anandtech のこの記事から説明のために引用します。
Nimbus Die側に
があるので、ここは変えなくてもいいんじゃないかと思っています。しかしながら、TSMCからこのDieの入手ができなくなると、作り直すことにはなるでしょうけど。
おわりに
Huawei Ascend 910CがNVIDIA H100に匹敵する性能というのが流れてきましたので、調べ直して、ブログにまとめました。
下記の記事に、SMIC 7nm/5nm について書かれています。
ご参考までに。