はじめに
昨日のブログの「はじめに」で紹介した deepvision (Edge AI processor : ARA-1) について、調べてみました。 vengineer.hatenablog.com
deepvision
- 2015年創業
- $19M の資金調達( 2020.11.16) deepvisionは、特許取得の「Polymorphic Dataflow Architecture」をベースとしたコアを8個搭載した ARA-1 processor ベースのボードを開発販売している会社です。
ARA-1 processor
ARA-1 processor は、(ARA-2 processor は、7nm で開発されているっぽい、CareersのSr Engineer, ASIC Physical Designに、Latest foundry nodes up to 7nmとあった)
- 8コア、L1付き
- L2として、4MB SRAM
- PCIe/USB 3.0 I/F
- 32bit LPDDR4
- 28nm
- 2W (Target : Professional Security Camera, Retail Camera)
- 2019年ES (2000ユニット以上を出荷?)
- USB, M.2 Board
- 15-25ドル
- ResNet-50を120FPS
- Intelに買収されたMovidius Myraid Xの4倍、Google Coral Edge TPUの6倍の低Latency、GPUに対して10倍の効率
- Deep Vision Compiler : Caffes, TensorFlow, PyTorch, MXNet, ONNX をサポート
- Deep Vision SDK : Simulator, Quantizer, Profiler, Optimizer を用意
ということが以下のURL の記事からわかりました。
- Deep Vision launches AI processor with novel data architecture for edge biometrics, 2020.11.16
- Dataflow Processor Serves Up High-End Low Latency, 2020.12.12
- Say Hello to Deep Vision’s Polymorphic Dataflow Architecture, 2020.12.24
- Edge AI On The Cheap and Deep, Startup Deep Vision Emphasizes Programmability, Efficiency, Cost, 2021.1.28
- Deep Vision Optimizes AI Data Flow, 2021.05.09
ポイントはソフトウェア
この記事にあった下図(説明のために引用します)から推測すると、図の上にあるのが処理のフロー。 このフローを以下の4つのFlowに分割 - Input Resident - Output Regident - Weight Resident - Depth-First
この4つのFlowの効率を最大化するために最適化する。
ARA-1 module のデモ
- Video Conference
- E-fitness
- Video Activity
- City Scape
- Smart City
論文
2つの論文がアップされています。しかしながら、2011年と2015年です。筆頭のRehan Hameed san と Wajahat Qadeer san が Co-Founder のお二人。Stanford Universityの研究成果の商品化っぽいです。
- Understanding Sources of Inefficiency in General-Purpose Chips, 2011
- Convolution Engine: Balancing Efficiency and Flexibility in Specialized Computing, 2015
おわりに
deepvision は既に ARA-1 processor ベースのボードをたくさん出荷しているようです。15-25ドルがチップなのか、モジュールなのかはわかりませんが、モジュールであれば、Google Coral Edge TPUよりかなりお安いと思います。