Mobile Machine Learning Hardware at ARM: A Systems-on-Chip (SoC) Perspectiveによると、CNN AccelaratorをSoCの内部バスに接続し、CPU Cluster内のL3のデータのやり取りを ACP 経由でやると。
下記の図は、引用です。
それでもって、
ソフトウェア・スタックのポイント The key of such a programming interface is a clear abstraction that allows applications to execute DNN jobs efficiently on (one of many) hardware accelerators, or fall back to execution on a CPU or GPU. The AndroidNN API provides an example of this principle, by abstracting common DNN kernels such as convolution, and scheduling execution through a hardware abstraction layer (HAL).
だと。
ARMもCNN Accelarator IP提供してくるか!
まー、そうでしょうね。。。。内部を知っているんですからね。ARMは。。。