はじめに
Ryzen AI については、このブログでも下記のように3回、紹介しています。
- AMD Ryzen AIを使うには、IPU Binary を使う。そして、IPU Binary は2種類ある!
- Ryzen AI の AI Engine は 1GHzで動いている
- Ryzen AI の DMA & NoCs とは?
Ryzen 8040シリーズの発表に合わせて、Ryzen AI SW も 0.9 => 1.0 になったようです。
上記のブログに書いた情報が既に削除されてしまっているものもあります。
tutorial
tutorial が更新されました。
- hello_world の追加
vaip_config.json
vaip_config.json の中に、xcompilerAttrsというキーワードがあります。
下記は、example/Ryzen-AI-Library/windows/vaip_config.json です。
"xcompilerAttrs": { "debug_mode" : { "stringValue" : "performance" }, "dpu_subgraph_num" : { "intValue" : 32 }, "opt_level" : { "intValue" : 0 }, "dump_subgraph_ops" : { "boolValue" : false }, "profile" : { "boolValue" : false }, "prefetch" : { "boolValue" : false }, "preassign" : { "boolValue" : false }, "disable_std_quant" : { "boolValue" : false }, "concat_skip_code_gen" : { "boolValue" : false } } }
下記は、demo/cloud-to-client/models/retinaface/cache/context.json です。
"xcompilerAttrs": { "concat_skip_code_gen": { "boolValue": false }, "debug_mode": { "stringValue": "performance" }, "prefetch": { "boolValue": false }, "disable_std_quant": { "boolValue": false }, "dpu_subgraph_num": { "intValue": 3 }, "opt_level": { "intValue": 2 }, "preassign": { "boolValue": false } } }
色々なパラメータがあるようですね。
optimum-amd
huggingface の optimum-amd でもxcompilerAttrsを使っています。
ここにあります。
"xcompilerAttrs": { "debug_mode" : { "stringValue" : "performance" }, "dpu_subgraph_num" : { "intValue" : 2 }, "opt_level" : { "intValue" : 0 }, "dump_subgraph_ops" : { "boolValue" : false }, "prefetch" : { "boolValue" : false }, "preassign" : { "boolValue" : false }, "disable_std_quant" : { "boolValue" : false }, "concat_skip_code_gen" : { "boolValue" : false } } }
おわりに
7040 => 8040 になると、1.6倍の性能になるようです。スマホでは当たり前になった NPU。PCでもAppleが先に導入して、Intelも導入。AMDも導入し、当たり前の技術になっていくんでしょうかね。。。
関連記事