HuaweiのMindsporeが github に来た？

今まで、gitee にあった、Huawei のディープ・ラーニングフレームワークであるMindspore が github に来た？

サクッて見てみたら、

をサポートしているっぽい。

OSは、Ubuntu と EulerOS (CentOSのHuawei版、Huawei Cloudで使われている)

CPUだけ、Windows 10で動く。EulerOSはAscendのみ。

Mindsporeのバイナリもダウンロードできる模様。

CUDAの時は、NCCL(NVIDIA Collective Communication Library)と使っていて、Ascendの時は、HCCL(Huawei Collective Communication Library)を使って要るっぽい。

HCCLとは、

HCCSはファーウェイが独自に開発した高速相互接続インターフェースで、オンチップRoCEがノード間の直接相互接続に使用できます。

用のライブラリかな。。。

下記の Atlas 900 のページを見ると、

HCCS + PCIe 4.0 + 100 GE

HCCS (Huawei Cache Coherence System)、になっていて、

240 Gbit/s: inter-chip interconnect enabled by HCCS

ともありますね。30GB/s ということは、PCIe Gen4 x16 相当かな、e.huawei.com

昨年(2019年)のHotchip 31 のスライドこの分(引用します)にある Hydra SubsysがHCCLのことで、Networkが 100G RoCEなんだろうね。

f:id:Vengineer:20200621121637j:plain

違う頁には、

ともあります。ね。

f:id:Vengineer:20200621122847j:plain

GraphEngineも github にあるんだよね。

ここにある下記の図(引用します)をみると、ほとんど公開されているのかな？

Backend Runtimeの下のレイヤーは無理でしょうけど。。。

Benchmarkとしては、ここに 0.2.0-alpha の Resnet50 v1.5のデータがあります。

PrecisionはMix(fp16/fp32)、Batch Size=32

大体スケールしている。

Habana Gaudi(現、Intel)のResnet-50のベンチマークがここの 22頁目にあって、

となっている。ということは、Gaudiよりちょっと速いということね。