記録のために残します。
・Distributed Caffe : 富士通が独自に開発した Caffe を MPI で分散並列化したもの。 (MPIで分散並列処理、得意でしょうからね。。なんで今までやっていなかったのでしょうか) ・分散並列データ供給技術 ・Deep Tensor(アルゴリズム高速化) (画像データではなく、グラフデータを) ・ディープラーニング専用プロセッサ DLU (2018年度から。。。、Tofu インターコネクト技術によるスケーラビリティ)
DLUについて、詳しく。
・1. 領域特化型(領域に特化したコア): 少数のマスターコアと多数の小型実行コア:DPU - 新規命令セット - 簡素化されたマイクロアーキテクチャ - ソフトウェアから透過、制御可能 - ヘテロジニアスコア - DPE と大容量レジスタファイル (DPUは、16個のDPEからなる) DPEは、大容量RFと8xSIMD実行ユニット ・2. 最適化演算精度 - Deep Learning Integer (8~16 bit の整数演算で) ・3. 高並列 (Massively Parallel) - 多数の DPU をチップ上ネットワークで接続 (Tofu インターコネクト技術)