・The name Glow is an abbreviation for Graph-Lowering.
・関連するプロジェクト:TensorFlow XLA, TVM/NNVM, DLVM, Tensor Comprehensions and nGraph
一応、全部、チェックしている。DLVMはどうやら止めて、Swift for TensorFlow に移行するって
一応、全部、チェックしている。DLVMはどうやら止めて、Swift for TensorFlow に移行するって
・C++コード(LeNet MNIST)による例題
モデル(グラフ構築)作って、EE.compile(CompilationMode::Infer, F); でMachine Codeを生成するって感じです。
モデル(グラフ構築)作って、EE.compile(CompilationMode::Infer, F); でMachine Codeを生成するって感じです。
OpenCLは、遂次実行( というファイル内にハードコーディングされている)
OpenCLは、遂次実行( というファイル内にハードコーディングされている)
1)、The high-level intermediate representation allows the optimizer to perform
domain-specific optimizations.
1)、The high-level intermediate representation allows the optimizer to perform
domain-specific optimizations.
2)、Conv層 と BN層を融合する
2)、Conv層 と BN層を融合する
2)、The lower-level instruction-based address-only intermediate representation
allows the compiler to perform memory-related optimizations,
グラフ最適化 => glow::optimize コード
Lower => glow::lower コード
IR最適化 => glow::optimize コード
instruction scheduling
static memory allocation
copy elimination.
instruction scheduling
static memory allocation
copy elimination.
"node lowering"を実行する。
コンパイラは High-level operator nodes を Low-level linear algebra operator nodes に変換する。
コンパイラは High-level operator nodes を Low-level linear algebra operator nodes に変換する。
Glow uses profile-guided quantization, observing execution
Glow is up to 2.5x faster than TensorFlow.
This is due to the fact that TensorFlow calls into Eigen which implements convolution
using the classic im2col followed by matrix multiplication,
while Glow compiles direct convolution and thus avoids im2col overhead.
・量子化This is due to the fact that TensorFlow calls into Eigen which implements convolution
using the classic im2col followed by matrix multiplication,
while Glow compiles direct convolution and thus avoids im2col overhead.
Glow uses profile-guided quantization, observing execution
during inference to estimate the possible numeric range for each stage of the neural network.
Training-based quantization is considered future work.
Training-based quantization is considered future work.