Vengineerの妄想(準備期間)

人生は短いけど、長いです。人生を楽しみましょう!

Ryzen AI SW update (1.0)

はじめに

Ryzen AI については、このブログでも下記のように3回、紹介しています。

Ryzen 8040シリーズの発表に合わせて、Ryzen AI SW も 0.9 => 1.0 になったようです。

上記のブログに書いた情報が既に削除されてしまっているものもあります。

tutorial

tutorial が更新されました。

vaip_config.json

vaip_config.json の中に、xcompilerAttrsというキーワードがあります。

下記は、example/Ryzen-AI-Library/windows/vaip_config.json です。

    "xcompilerAttrs": {
        "debug_mode" : {
            "stringValue" : "performance"
        },
        "dpu_subgraph_num" : {
            "intValue" : 32
        },
        "opt_level" : {
            "intValue" : 0
        },
        "dump_subgraph_ops" : {
            "boolValue" : false
        },
        "profile" : {
            "boolValue" : false
        },
        "prefetch" : {
            "boolValue" : false
        },
        "preassign" : {
            "boolValue" : false
        },
        "disable_std_quant" : {
            "boolValue" : false
        },
        "concat_skip_code_gen" : {
            "boolValue" : false
        }
     }
   }

下記は、demo/cloud-to-client/models/retinaface/cache/context.json です。

     "xcompilerAttrs": {
      "concat_skip_code_gen": {
       "boolValue": false
      },
      "debug_mode": {
       "stringValue": "performance"
      },
      "prefetch": {
       "boolValue": false
      },
      "disable_std_quant": {
       "boolValue": false
      },
      "dpu_subgraph_num": {
       "intValue": 3
      },
      "opt_level": {
       "intValue": 2
      },
      "preassign": {
       "boolValue": false
      }
     }
    }

色々なパラメータがあるようですね。

optimum-amd

huggingface の optimum-amd でもxcompilerAttrsを使っています。

ここにあります。

    "xcompilerAttrs": {
        "debug_mode" : {
            "stringValue" : "performance"
        },
        "dpu_subgraph_num" : {
            "intValue" : 2
        },
        "opt_level" : {
            "intValue" : 0
        },
        "dump_subgraph_ops" : {
            "boolValue" : false
        },
        "prefetch" : {
            "boolValue" : false
        },
        "preassign" : {
            "boolValue" : false
        },
        "disable_std_quant" : {
            "boolValue" : false
        },
        "concat_skip_code_gen" : {
            "boolValue" : false
        }
     }
   }

おわりに

7040 => 8040 になると、1.6倍の性能になるようです。スマホでは当たり前になった NPU。PCでもAppleが先に導入して、Intelも導入。AMDも導入し、当たり前の技術になっていくんでしょうかね。。。

関連記事

community.amd.com

www.amd.com