Vengineerの戯言

人生は短いけど、長いです。人生を楽しみましょう!

機械学習用アクセラレーター入り x86 プロセッサ

@Vengineerの戯言 : Twitter
SystemVerilogの世界へようこそすべては、SystemC v0.9公開から始まった 

ascii.jp

この記事によると、VIAのCentaurにAIコプロセッサ内蔵のx86互換CPUがあるみたい。

CHAというのがベースのSoCで、このCHAにNcoreと呼ばれる機械学習用のアクセラレーターを追加したと。

CHAは、Haswellと同等のIPCを持つ性能で、8コアでリング接続。4つのDDR4 DRAMコントローラもある。製造プロセスは16nm FFCで 2.5 GHzで動く。PCIe lanesは44本もある。

下図はURL組み込みによる引用。

https://ascii.jp/img/2020/04/25/3037782/l/f5e5d1638a0266ab.jpg

 

GPUの代わりに Ncore を入れた感じのレイアウト図。左側に、Ncoreの計算コアと2組のRAMがあると。

下図はURL組み込みによる引用。

https://ascii.jp/img/2020/04/25/3037784/l/c46578ae4d4451c6.jpg

 

Ncoreは、PCIバイスとして認識される感じ。

下図はURL組み込みによる引用。

https://ascii.jp/img/2020/04/25/3037785/l/3b75321b3f4be847.jpg

 

AVX32768 = 16 slices * 256 bytes wide (4096 bytes wide = 32768 bits)

これらが 2.5GHz で動く。RAMも 4096 RAM "rows" * 4KB/row x 2 RAMs = 16MB

下図はURL組み込みによる引用。

https://ascii.jp/img/2020/04/25/3037787/l/4a07190e2204dd6a.jpg

 

横に広くした AVX 。。。

これって、どんなアプリケーションだと効果的なんでしょうかね。

 

ISCA2020 では、論文が公開されていますね。

High-Performance Deep-Learning Coprocessor Integrated into x86 SoC with Server-Class CPUs

こちらにも詳しく書いてありますね。