Vengineerの戯言

人生は短いけど、長いです。人生を楽しみましょう!

Xilinx Versal AI Engine

@Vengineerの戯言 : Twitter SystemVerilogの世界へようこそすべては、SystemC v0.9公開から始まった 

はじめに

Xilinx の Versal に搭載されている AI Engine がどうなっているかを調べてみました

ACAP (Adaptive Compute Acceleration Platform)

XilinxのZynq/Zynq MPSoCに続く新しいシリーズである ACAP (Adaptive Compute Acceleration Platform)

japan.xilinx.com

ACAP には、5つのシリーズ (AIエッジシリーズについては、2021.09.23に追記)

  • HBMシリーズ
  • プレミアムシリーズ
  • プライムシリーズ
  • AIコアシリーズ
  • AIエッジシリーズ

最後の AIコアシリーズとAIエッジシリーズにのみ、AI Engine が載っています。

Versal AI Core

japan.xilinx.com

  • VC1352 : 128
  • VC1502 : 248
  • VC1702 : 320
  • VC1802 : 300
  • VC1902 : 400

実機は、VCK190評価キット あh、11,995ドル。お高い。。。。

Versal AI Edge

japan.xilinx.com

Versal AI Edgeでは、AIエンジンがAIエンジン-MLになって、INT8の性能が倍に、INT4とBF16をサポート。また、データメモリが32KBから64Kに強化。メモリTileなるものも追加。 Xilinx、Versalシリーズの第4弾製品「Versal AI Edge」を発表

また、メモリ階層が変わります。アクセラレータRAMなる4MBが追加されました。説明のために上記の記事の図を引用します。

f:id:Vengineer:20210923092159p:plain

  • VE2002
  • VE2102
  • VE2202
  • VE2302
  • VE2602
  • VE1752
  • VE2802

この中で VE1752だけは、AIエンジン-ML ではなく、AIエンジンですので、実態は Versal AI Core のVC2802なんだろうかな?と思っています。

アーキテクチャマニュアル

Versal ACAP AI エンジン アーキテクチャ マニュアル

開発環境

Versal ACAP AI エンジン プログラム環境 ユーザー ガイド

SystemC Simulator (aiesimulator)

  • AI Engine SystemC Simulator (aiesimulator) にて、DDRメモリ、NoC を含んだモデリングができているっぽい。
  • VCDファイルをダンプできる
  • DDRメモリを初期化データをロードできる
  • プログラムメモリとデータメモリの境界アクセスチェックができる

SystemC シミュレーション (AI エンジン System C シミュレータ 参照) では、AI エンジン アレイのタイミングとリソースは正確にモデル化されますが、NoCDDR、PL、および PS に関してはトランザクシ ョン レベルの AT (Approximately Timed) SystemC モデルが使用されます。これにより、AI エンジン アプリケーショ ンの性能解析を適度な時間と精度で実行できます。

その他

  • ハードウェアエミュレーション
  • 3rd party (Questa, Xcelium) も利用可能

  • x86 論理シミュレータ (x86simulator) もある

  • Trace Compass なるもので AI Engineのトレースが可視化

おわりに

AI Engine 、何で開発したのかはわかりましたが、ここには書けません。。。。

参考資料: マイナビ : XDF 2018 - VersalのAI Engineの構造

P.S 2021.09.26(日)の11:00-12:00の「半導体チップ雑談」しました。 チップ入手が2022年下期ということなので、デバイス無いとなかなか本気出さないよね、となりました。 FPGAの場合は、直ぐに動作確認できるので、やっぱりデバイス必要なんですね。 ASICの場合は、デバイスなんて、かなり先なのでシミュレータでもOKなんですよね。そこが違うんですね。