Vengineerの妄想(準備期間)

人生は短いけど、長いです。人生を楽しみましょう!

ARM MaliでもTVM


Optimizing Mobile Deep Learning on ARM GPU with TVMは、OpenCLコードを生成して、ARM Mali-T880MP4で実行。


ARM Compute Library v17.12で実装したNEON版およびOpenCL版より速くしたよというもの。

ターゲットデバイスは、Firefly-RK3399

ARM Mali搭載のSoC評価ボードでOpenCLが使えるのは、このFirefly-RK3399とOdroid-XU3/4ぐらいだからね。
Odroid-UX3/4は、ARM Mali-T628MP6だから、2世代古いんだよね。

ARM Mali-T880MP4も実は古くて、最新版はBifrostアーキテクチャG71/G72

SamsungのExynos 8895は、ARM Mali G71MP20を搭載。
また、最新のSamsungのExynos 9810は、ARM Mali G71MP18を搭載。

あー、そうだ、Hikey960もGS71MP8を搭載しているんだけど、OpenCLライブラリが供給されていないんだよね。

Firefly-RK3399は、T880MP4で、Hikey960はG71MP8なので、4コア vs 8コアで、速くなるかな。。。