Google君に聞くお仕事していたら、見つけました。
Androidのデモアプリのソースコードも公開されています。
引用 ModelBuilder modelBuilder = new ModelBuilder(); Model model = modelBuilder.readFile(getAssets(), "mobilenetv2.daq") .setOutput("mobilenetv20_output_pred_fwd"); // The output name is from the onnx model .compile(ModelBuilder.PREFERENCE_FAST_SINGLE_ANSWER); float[] result = model.predict(inputData);
感じで、5行で書けるというのがポイントんようです。
ONNXモデルを事前に、onnx2dag というツールで変換したモデルを利用するようです。
量子化は、ONNXモデルがそのようになっていればいいと思うのだが、どうだろうか?