このブログでも、11月4日に書いたColossus GC2 chipは、IPU-Cores なるものが1216個搭載されていると。
各IPUは、100GFlopsでかつ、7スレッドで動く。また、チップあたり300MBのメモリを持ち、30TB/sのメモリ帯域。化け物。。。
各IPUは、low precision floating pointをサポートで、23.6Bトランジスタ。。。
各IPUは、low precision floating pointをサポートで、23.6Bトランジスタ。。。
各GC2チップは、80 IPU-Links なるチップ間インターコネクトにて、2.5Tbpsの転送レート。
PCIe Gen 4 x16で、チップ間転送では、IPU-Exchangeなるもので、8TB/sの転送レート。
PCIe Gen 4 x16で、チップ間転送では、IPU-Exchangeなるもので、8TB/sの転送レート。
1枚のPCIeボードには、GC2が2チップ搭載されていて、Dell EMCのサーバーには8枚搭載できる。
トータルのIPU数は、19.5K個(1216*2*8=19,456)で、2.0PFlopsの性能だって。
トータルのIPU数は、19.5K個(1216*2*8=19,456)で、2.0PFlopsの性能だって。
ソフトウェアは、Poplarで、TensorFlowやPyTorchをサポート。
とうとう、出てきましたね。Graphcoreのチップが。。。さて、どうなるか?