@Vengineerの戯言 : Twitter
SystemVerilogの世界へようこそ、すべては、SystemC v0.9公開から始まった
も一つ、SnapgragonのGPUネタ。こちらも、Qualcommの中の人。
こちらは865ではなく、855のAdreno A640
どんだけ性能が上がったのか?
Vanilla TVM only OpenCL buffers (baseline) 49.08 s
OpenCL buffer + local memory: 29.22 s => 1.67 倍
Image1d buffer (CL_R) + local memory 26.72 s => 1.83 倍
Image1d buffer (CL_R) + local memory + single layer finetuned
25.42 s => 1.93 倍
Image1d buffer (CL_R) + optimal local memory strategies
18.48 s => 2.65 倍
Hand optimized kernels, not TVM 12.00 s => 4.02 倍
と人間が GPU のアーキテクチャを気にしてチューニングして、4.02 倍
TVM では、2.65 倍
まだまだなのか?それとも、凄いのか?よくわかりません。