Vengineerの妄想(準備期間)

人生は短いけど、長いです。人生を楽しみましょう!

JetPack 3.1 & TensorRT 2.1



最近ご無沙汰なGPU.

Jetson TK1とTX1は、お仕事用にあるのですが。。。ね。

JetPack 3.1になり、TensorRT 1.0に対して、TensorRT 2.1では、バッチサイズ1の推論速度が約2倍に。。。
TensorRTでは、TensorRT 3になっていますが。。。


それから、カスタムレイヤーに対して、plugin API (C++)が用意されているようで。。

引用
#include "NvInfer.h"

using namespace nvinfer1;
class MyPlugin : IPlugin
{
public:
   int getNbOutputs() const;
   Dims getOutputDimensions(int index, const Dims* inputs, 
                            int nbInputDims);
   void configure(const Dims* inputDims, int nbInputs, 
                  const Dims* outputDims, int nbOutputs, 
                  int maxBatchSize);
   int initialize();
   void terminate();
   size_t getWorkspaceSize(int maxBatchSize) const;
   int enqueue(int batchSize, const void* inputs, 
               void** outputs, void* workspace, 
               cudaStream_t stream);
   size_t getSerializationSize();
   void serialize(void* buffer);
protected:
   virtual ~MyPlugin() {}
};

plugin APIのドキュメント、ここん、Win速いわけではないのね。んといっても、ラズパイのソフトウェアエコシステムは莫大だからね。