はじめに
NVIDIA の GPU には、Copy Engine (つまり、DMA Engine) が搭載されています。
Copy Engine はどこにある?
NVIDIAの公式文書としては、GP100 Pascal Whitepaper に、下記の図があり、HSHUB (High Speed Hub) に High-Speed Copy Engines (HSCE) なるものが接続しています。図を説明のために引用します。
PC Watchの後藤さんの記事において、TU102 と GA102 の内部ブロック図が載っています。それぞれの図の一部を説明のために引用します。この図は、上記のGP100の図と同じです。
NVIDIA open-gpu-kernel-module を見てみる
この コード の中に、Turning/Ampere/Hopper/Ada の各Copy Engineの情報があります。
- Turning (TU102, TU104, TU106, TU116, TU117)
- Ampere (GA102, GA103, GA104, GA160, GA107)
- Ada (AD102, AD103, AD104, AD106, AD107)
内のCopy Engineの数は、5個です。
サーバー用のCopy Engineは、
- Pascal (GP100) : 10個
- Volta (GV100) : 10 個
- Ampere (GA100) : 16 => 10個
- Hopper (GH100) : 16 => 10個
おわりに
Desktop 用のGPUには、SMの数によらず、Copy Engine が5個入っています。この部分は、Turning, Ampere, Ada まで変わっていないんでしょうかね。