@Vengineerの戯言 : Twitter
SystemVerilogの世界へようこそ、すべては、SystemC v0.9公開から始まった
HotChips32を振り返る、3日目は、IBM POWER10。
このブログでも何度かPOWER8/9の記事をアップしています。
まだまだ、続いている POWER。プロセスは、Samsung 7nm。
GFとお仲間なので、Samsungを使っているのでしょうか?
既に、POWER11も開発中だと。
- 15コア、SMT8、2MB L2 Cache/core (120 Threads)
- 120MB L3
- Open Memory Interface (1 Terabyte / Sec) => Main DRAM, GDDR DIMMS, Storage class など
- PowerAXON Interface (OpenCAPI attach for memory, accelerators, I/O (1 Terabyte / Sec) => Chip間接続、最大 16 SCM socket
- PCIe Gen 5
- Single-Chip / Dual-CHip
AI Infusedとして、
- 4x matrix SIMD acceleration
- 2x bandwidth & general SIMD
- 4x L2 cacha capacity with improved thread isolation
- New ISA with AI data-types => bfloat16
POWER10 : Matrix Math Assist (MMA) Instructions
- 8 512b architectured Accumulator (ACC) Registers
- 4 powerfull units per SMT8 core
x86-64 Xeon と同じように、Matrix Math 命令をサポート。
bfloat16もサポートなので、もう、コモディティ。。。
性能は、FP32(Resnet-50)でPOWRE9に対して、10倍。Bfloat16では15倍以上、INT8だと20倍以上。
POWER10って、IBM以外のユーザーってどのくらいいるんでしょうかね。
このブログでのPOWER関連記事