IntelのLake Crestについて、お正月に調べてみました。
Intelは、
4つ目のLake Crestを手に入れたと、
・Xeon ・Xeon Phi : Knights Light => Knights Mill(2017) ・Xeon + FPGA(Arria 10)のMCP ・Xeon + Lake Crest => Knights Crestと今までは、上の3つだったけど、Nervanaを買収したことで、
4つ目のLake Crestを手に入れたと、
上の図は、PC Watchからの引用です。
(pc.watch.impress.co.jp/img/pcw/docs/1034/408/39.jpg)
上のアーキテクチャ図を見ると、
・12個のProcessing Cluster (FlexPoint) ・4個のメモリーコントローラ (HBM2) : 8GBx4=32GB ・2個のICC ・12個のICL (Inter Chip Link) : 100Gbps ・PCIe x16 (DMA付き) ・28nm ・その他(SPI/IC2/GPIO/Management CPU)
NVIDIAのPascal(Tesla P100)は、
・56個のSM(56*64=3584個のFP32 CUDA Cores) ・4096-bit HBM2 : 16GB ・4個のNVLink ・PCIe x16 (たぶんDMA付き) ・16nmという構成です。
共に、
・計算ユニット ・高メモリバンド幅のメモリ(HBM2) ・高速チップ間インターフェース ・PCIe x16
DeepLearningでは、NVIDIAのGPUでどんどん先に進んでいましたが、
今回のIntel Lake Crestを投入し、その差を縮め、
その先のKnights Crestでもっと差を縮めると。
今回のIntel Lake Crestを投入し、その差を縮め、
その先のKnights Crestでもっと差を縮めると。
10nm/7nmをDeepLearningというアプリケーションにどう投入するか?