Vengineerの妄想

人生を妄想しています。

HotChips32を振り返る:POWER10

@Vengineerの戯言 : Twitter
SystemVerilogの世界へようこそすべては、SystemC v0.9公開から始まった 

HotChips32を振り返る、3日目は、IBM POWER10。

このブログでも何度かPOWER8/9の記事をアップしています。

まだまだ、続いている POWER。プロセスは、Samsung 7nm。

GFとお仲間なので、Samsungを使っているのでしょうか?

www.anandtech.com

既に、POWER11も開発中だと。

  • 15コア、SMT8、2MB L2 Cache/core (120 Threads)
  • 120MB L3
  • Open Memory Interface (1 Terabyte / Sec) => Main DRAM, GDDR DIMMS, Storage class など
  • PowerAXON Interface (OpenCAPI attach for memory, accelerators, I/O (1 Terabyte / Sec) => Chip間接続、最大 16 SCM socket
  • PCIe Gen 5
  • Single-Chip / Dual-CHip

AI Infusedとして、

  • 4x matrix SIMD acceleration
  • 2x bandwidth & general SIMD
  • 4x L2 cacha capacity with improved thread isolation
  • New ISA with AI data-types => bfloat16

POWER10 : Matrix Math Assist (MMA) Instructions

  • 8 512b architectured Accumulator (ACC) Registers
  • 4 powerfull units per SMT8 core

x86-64 Xeon と同じように、Matrix Math 命令をサポート。

bfloat16もサポートなので、もう、コモディティ。。。

性能は、FP32(Resnet-50)でPOWRE9に対して、10倍。Bfloat16では15倍以上、INT8だと20倍以上。

 

POWER10って、IBM以外のユーザーってどのくらいいるんでしょうかね。

 

このブログでのPOWER関連記事

vengineer.hatenablog.com

vengineer.hatenablog.com

vengineer.hatenablog.com