Vengineerの妄想(準備期間)

人生は短いけど、長いです。人生を楽しみましょう!

Wave Computing


Wave Computing: a Dataflow Processor for Deep Learningによると、
Wave Computingは、dataflow processing elementを4個でクラスタを構成し、
8〜64クラスタの塊をAXIで接続するようになっている。

DPU(Dataflow Processing Unit)を4つ搭載したDPU Boardを4枚で、
Deep Learning Computerに。
このDeep Learning Computerには、256,000プロセッサ、
256MBの分散型SRAM、32GB HMC DRAM、そして、1TBのDDR4を搭載しているそうな。

DPUは、
 ・16FFで開発
 ・16,000プロセッサ(8192ALU):4PEで2個のALU
 ・PCIe 3.0 16-laneでホストと接続

ここに、DPUが4つ載ったDPU Boardのブロック図があります。
MHCが4つ載っています。各DPUには、DDR4が接続されています。

Making Waves In Deep Learningには、チップのレイアウト図があります。ひえー、いっぱいPE(16K個)が載っている。

アーリー・アクセスが2016年後半(といっても、上の記事では10月テープアウトだから無理)
2017年Q2に商品がリリースされるようです。