@Vengineerの戯言 : Twitter
SystemVerilogの世界へようこそ、すべては、SystemC v0.9公開から始まった
マイナビの
CEVA、エッジ向け次世代AI推論プロセッサアーキテクチャを発表
を読んで感じたこと。
CEVAのNeuPro-Sって、
— Hatenaブログに移行したよ (@Vengineer) September 20, 2019
小さな、Google TPU v1 という感じかな?
TPU v1のMatrix演算(65536=256*256)だけど、
NeuPro-Sでは、1000、2000、4000があるって、https://t.co/3Zl0gKyFBI
を読んでみたら、1000(1024)、2000(2048)、4000(4096)って、MACの数じゃなくて、8x8 MACの数だったんですね。16x16だと、256~1024。
なので、1024*8*8=64Kで、TPU v1 と同じじゃん。。。ちいとも小さくない。。。
下記の図は、上記記事からの引用ですが、なんか見たことがある図だなと思っていたら、
Verisilicon(旧Vivante)のVIP8000と同じ。
VeriSilicon's Vivante VIP8000 Neural Network Processor IP Delivers Over 3 Tera MACs Per Second
から引用した下図。これと同じ。
というより、自分で調べた「DSPでディープラーニング」を見ると、DSPだと同じような構成になるんだなーと。
具体的には、