Vengineerの戯言

人生は短いけど、長いです。人生を楽しみましょう!

IWOCL '20 : Snapdragon の GPU で TVM

@Vengineerの戯言 : Twitter
SystemVerilogの世界へようこそすべては、SystemC v0.9公開から始まった 

も一つ、SnapgragonのGPUネタ。こちらも、Qualcommの中の人。

TVM for Adreno GPUs

こちらは865ではなく、855のAdreno A640

どんだけ性能が上がったのか?

Vanilla TVM only OpenCL buffers (baseline)               49.08 s
OpenCL buffer + local memory:                                 29.22 s     => 1.67 倍
Image1d buffer (CL_R) + local memory                      26.72 s     => 1.83 倍
Image1d buffer (CL_R) + local memory + single layer finetuned
                                                                                    25.42 s     => 1.93 倍
Image1d buffer (CL_R) + optimal local memory strategies
                                                                                    18.48 s     => 2.65 倍

Hand optimized kernels, not TVM                              12.00 s     => 4.02 倍

 

と人間が GPUアーキテクチャを気にしてチューニングして、4.02 倍

TVM では、2.65 倍

 

まだまだなのか?それとも、凄いのか?よくわかりません。