@Vengineerの戯言 : Twitter
SystemVerilogの世界へようこそ、すべては、SystemC v0.9公開から始まった
車には全く興味は無いんですが、とりあえず、記録として
Teslaのチップ FSD
TeslaFSDチップには、2個のNNAが搭載されている。NNAは2GHz以上のクロックで動作する。96×96のMACを持ち、1個のNNAが36.8TOPSの演算能力を持つ。またNNAは32MBのメモリを持ち、NNAのプログラムはこのメモリに格納される
とありますね。NNAの詳細については、次の記事にありますね。
入力データと重みをMACで計算し、SIMDエンジンでその後の処理して、Pooling / DeConv をするって感じ。MICROARCHTECTUREの図も載っています。
入力データと重みはSRAMにおいて、入力データは256B単位、重みは128B単位。
処理後は同じSRAMに128B単位で書き戻されます。
入力データはキャッシュにあって、Data Alignmentをする回路経由でMACに供給される。
SIMDエンジンの詳細までありますね。
結構詳細まで情報だしているんですね。。。