Vengineerの妄想(準備期間)

人生は短いけど、長いです。人生を楽しみましょう!

TVM v0.2リリース


TVM v0.2がリリースされました。

v0.1がリリースされたのは、2017年8月17日なので、約6か月ですね。

引用
  Backend support
    Support LLVM mainline(4.0, 5.0, 6.0)
    Support ROCM stack for AMD GPUs
    More robust OpenCL support for ARM GPUs
  Android RPC runtime
    Multi-threading optimization for ARM
    multi-threaded depthwise
    multi-threaded conv2d
  New schedule primitives
    storage_align for shared memory alignment
    double_buffer
  UnrollLoop : more robust version of unroll loop, count maximum steps that can be unrolled.
  Full set of TOPI operators
    Introduce tvm.target to specify target options for compilation better.
    broadcast/ reduction operators
    pooling and global pooling
    Generic target support for topi
    schedule with external libraries
  End to end deep learning pipelines for CPU, GPU, ARM GPU
  Tutorials
    How to load compiled module in any language runtime
    How to use java runtime
  Contrib library: MIOpen, CuDNN
  Ongoing items that contains functioning pieces
    WebGL backend
    C++ compiler support
    MPS DNN
   low bit support, introduced popcount 

NNVM/TVM on HiKey960ARM MaliでもTVMや、AMD GPUサポートもありました。

それらがまとめてアップされたようです。



  GRAPHOPTIMIZATION
  ・ConstantFolding
  ・GraphSimplificatio
  ・Kernel Fusion
  ・Pre-computingLayoutTransformation
  ・Quantization

追記)、2018.03.08
SysMLの講演ビデオが公開されました:SysML 18: Tianqi Chen, TVM: End-to-End Compilation Stack for Deep Learning