@Vengineerの戯言 : Twitter SystemVerilogの世界へようこそ、すべては、SystemC v0.9公開から始まった
はじめに
Xilinx の Versal に搭載されている AI Engine がどうなっているかを調べてみました
ACAP (Adaptive Compute Acceleration Platform)
XilinxのZynq/Zynq MPSoCに続く新しいシリーズである ACAP (Adaptive Compute Acceleration Platform)
ACAP には、5つのシリーズ (AIエッジシリーズについては、2021.09.23に追記)
- HBMシリーズ
- プレミアムシリーズ
- プライムシリーズ
- AIコアシリーズ
- AIエッジシリーズ
最後の AIコアシリーズとAIエッジシリーズにのみ、AI Engine が載っています。
Versal AI Core
- VC1352 : 128
- VC1502 : 248
- VC1702 : 320
- VC1802 : 300
- VC1902 : 400
実機は、VCK190評価キット あh、11,995ドル。お高い。。。。
Versal AI Edge
Versal AI Edgeでは、AIエンジンがAIエンジン-MLになって、INT8の性能が倍に、INT4とBF16をサポート。また、データメモリが32KBから64Kに強化。メモリTileなるものも追加。 Xilinx、Versalシリーズの第4弾製品「Versal AI Edge」を発表
また、メモリ階層が変わります。アクセラレータRAMなる4MBが追加されました。説明のために上記の記事の図を引用します。
- VE2002
- VE2102
- VE2202
- VE2302
- VE2602
- VE1752
- VE2802
この中で VE1752だけは、AIエンジン-ML ではなく、AIエンジンですので、実態は Versal AI Core のVC2802なんだろうかな?と思っています。
アーキテクチャマニュアル
Versal ACAP AI エンジン アーキテクチャ マニュアル
開発環境
Versal ACAP AI エンジン プログラム環境 ユーザー ガイド
SystemC Simulator (aiesimulator)
- AI Engine SystemC Simulator (aiesimulator) にて、DDRメモリ、NoC を含んだモデリングができているっぽい。
- VCDファイルをダンプできる
- DDRメモリを初期化データをロードできる
- プログラムメモリとデータメモリの境界アクセスチェックができる
SystemC シミュレーション (AI エンジン System C シミュレータ 参照) では、AI エンジン アレイのタイミングとリソースは正確にモデル化されますが、NoC、DDR、PL、および PS に関してはトランザクシ ョン レベルの AT (Approximately Timed) SystemC モデルが使用されます。これにより、AI エンジン アプリケーショ ンの性能解析を適度な時間と精度で実行できます。
その他
- ハードウェアエミュレーション
3rd party (Questa, Xcelium) も利用可能
x86 論理シミュレータ (x86simulator) もある
Trace Compass なるもので AI Engineのトレースが可視化
おわりに
AI Engine 、何で開発したのかはわかりましたが、ここには書けません。。。。
参考資料: マイナビ : XDF 2018 - VersalのAI Engineの構造
P.S 2021.09.26(日)の11:00-12:00の「半導体チップ雑談」しました。 チップ入手が2022年下期ということなので、デバイス無いとなかなか本気出さないよね、となりました。 FPGAの場合は、直ぐに動作確認できるので、やっぱりデバイス必要なんですね。 ASICの場合は、デバイスなんて、かなり先なのでシミュレータでもOKなんですよね。そこが違うんですね。