Xilinxのブログから
Snowflake CNN Accelerator implemented on Zynq Z-7045 SoC delivers impressive benchmarks on GoogLeNet, ResNet
Snowflake CNN Accelerator implemented on Zynq Z-7045 SoC delivers impressive benchmarks on GoogLeNet, ResNet
論文は、
Snowflake: A Model Agnostic Accelerator for Deep Convolutional Neural Networks
Compiling Deep Learning Models for Custom Hardware Accelerators
Snowflake: A Model Agnostic Accelerator for Deep Convolutional Neural Networks
Compiling Deep Learning Models for Custom Hardware Accelerators
Tourch7のモデルを利用するみたい。
コンパイラでは、Torch7モデルから、
・model structure parsing ・CNN workload breakdown ・loop rearrangement for memory bandwidth optimizations and memory access balanciingをやっているようです。
Snowflake 上で AlexNet と ResNet18 推論が動く。
実装は、Xilinx’s Zynq XC7Z045 FPGAに256PU搭載で、250MHzで動いている。。。(250MHzで動かすとは、凄いぞ)
実装は、Xilinx’s Zynq XC7Z045 FPGAに256PU搭載で、250MHzで動いている。。。(250MHzで動かすとは、凄いぞ)
AlexNet で、93.6 frames/s & 1.2 GB/s of off-chip memory bandwidth
ResNet18 では、21.4 frames/s and 2.2 GB/s
ResNet18 では、21.4 frames/s and 2.2 GB/s
消費電力は、5W
Nextplatformの記事:Wrenching Efficiency Out of Custom Deep Learning Accelerators