Cambricon MLU100-Base と Cambricon MLU100-Perf は、Half Precision 一点攻め。
NVIDIAのTesla V100に対して、Half Precisionなら 2倍 から 3倍 速いよ。。。
ただし、メモリがDDR4-3200(表のDDR4-1600は誤りの模様) x 256bit なので、
102.4GB/s (Tesla V700は、900GB/s)
102.4GB/s (Tesla V700は、900GB/s)
TDPが 80W / 100W なので、こちらも、Tesla V100に比べて、1/2 から 1/3 なんでしょうかね。
こういう作戦もあるんですね。。。