Intel Lake Crest - Vengineerの妄想(準備期間)

@Vengineerの戯言 : Twitter
SystemVerilogの世界へようこそ、すべては、SystemC v0.9公開から始まった

IntelのLake Crestについて、お正月に調べてみました。

32GBのHBM2を搭載したディープラーニング専用ASIC「Lake Crest」は2017年末に登場
と
加速するIntelの深層学習ソリューション

Intelは、

　・Xeon
　・Xeon Phi : Knights Light => Knights Mill(2017)
　・Xeon + FPGA(Arria 10)のMCP

　・Xeon + Lake Crest => Knights Crest

と今までは、上の3つだったけど、Nervanaを買収したことで、
4つ目のLake Crestを手に入れたと、

http://pc.watch.impress.co.jp/img/pcw/docs/1034/408/39.jpg
上の図は、PC Watchからの引用です。
(pc.watch.impress.co.jp/img/pcw/docs/1034/408/39.jpg)

上のアーキテクチャ図を見ると、

　・12個のProcessing Cluster (FlexPoint)
　・4個のメモリーコントローラ (HBM2) : 8GBx4=32GB
　・2個のICC
　・12個のICL (Inter Chip Link) : 100Gbps
　・PCIe x16 (DMA付き)
　・28nm
　・その他(SPI/IC2/GPIO/Management CPU)

これって、NVIDIAのPascalとよく似ていいます。

NVIDIAのPascal(Tesla P100)は、

　・56個のSM(56*64=3584個のFP32 CUDA Cores)
　・4096-bit HBM2 : 16GB
　・4個のNVLink
　・PCIe x16 (たぶんDMA付き)
　・16nm

という構成です。

共に、

　・計算ユニット
　・高メモリバンド幅のメモリ(HBM2)
　・高速チップ間インターフェース
　・PCIe x16

HPCでは、NVIDIAのGPUの後を追って、IntelがXeon Phiを投入したように。

DeepLearningでは、NVIDIAのGPUでどんどん先に進んでいましたが、
今回のIntel Lake Crestを投入し、その差を縮め、
その先のKnights Crestでもっと差を縮めると。

NVIDIAとIntelの違いは、Fabを持っているかどうか。

10nm/7nmをDeepLearningというアプリケーションにどう投入するか？

IntelはMemoryという鉱脈からCPUという鉱脈に賭けたように
DeepLearningという新しい鉱脈に賭けたのでしょうね。

P.S
この資料、Intel Lake Crestについてよくまとまっています。