2018-01-25 ARM MaliでもTVM TVM (NNVM/Relay) #その他コンピュータ Vengineerの戯言 : Twitter、Slideshare SystemVerilogの世界へようこそ、すべては、SystemC v0.9公開から始まった Optimizing Mobile Deep Learning on ARM GPU with TVMは、OpenCLコードを生成して、ARM Mali-T880MP4で実行。 コードは、githubに ARM Compute Library v17.12で実装したNEON版およびOpenCL版より速くしたよというもの。 ターゲットデバイスは、Firefly-RK3399 ARM Mali搭載のSoC評価ボードでOpenCLが使えるのは、このFirefly-RK3399とOdroid-XU3/4ぐらいだからね。 Odroid-UX3/4は、ARM Mali-T628MP6だから、2世代古いんだよね。 ARM Mali-T880MP4も実は古くて、最新版はBifrostアーキテクチャのG71/G72 SamsungのExynos 8895は、ARM Mali G71MP20を搭載。 また、最新のSamsungのExynos 9810は、ARM Mali G71MP18を搭載。 あー、そうだ、Hikey960もGS71MP8を搭載しているんだけど、OpenCLライブラリが供給されていないんだよね。 Firefly-RK3399は、T880MP4で、Hikey960はG71MP8なので、4コア vs 8コアで、速くなるかな。。。