今度の「Halide」は、Differentiable Programming に挑戦だ。
Image Processing and Deep Learning への応用。。。
論文だけでなくソースコードも公開されています。
Jonathan Ragan-Kelley さん、UC Berkeleyだけでなく、Googleにも所属している模様。
Runtimeの実装コードの比較で下記のように、Halideが圧勝です。
・CUDA : 308行、1MPix (430 ms)、4MPix (2270 ms) ・PyTorch :42行、1MPix (1140 ms)、4MPix (out of memory) ・Halide : 22行、1MPix (64 ms)、4MPix ( 165 ms)
いやー、凄いな「Halide」。。。
ちなみに、あたしは、「Differentiable Programming」は、よくわからないです。