Vengineerの妄想

人生を妄想しています。

NVIDIA GPU の Copy Engine

はじめに

NVIDIAGPU には、Copy Engine (つまり、DMA Engine) が搭載されています。

Copy Engine はどこにある?

NVIDIAの公式文書としては、GP100 Pascal Whitepaper に、下記の図があり、HSHUB (High Speed Hub) に High-Speed Copy Engines (HSCE) なるものが接続しています。図を説明のために引用します。

PC Watchの後藤さんの記事において、TU102 と GA102 の内部ブロック図が載っています。それぞれの図の一部を説明のために引用します。この図は、上記のGP100の図と同じです。

NVIDIA open-gpu-kernel-module を見てみる

この コード の中に、Turning/Ampere/Hopper/Ada の各Copy Engineの情報があります。

  • Turning (TU102, TU104, TU106, TU116, TU117)
  • Ampere (GA102, GA103, GA104, GA160, GA107)
  • Ada (AD102, AD103, AD104, AD106, AD107)

内のCopy Engineの数は、5個です。

サーバー用のCopy Engineは、

  • Pascal (GP100) : 10個
  • Volta (GV100) : 10 個
  • Ampere (GA100) : 16 => 10個
  • Hopper (GH100) : 16 => 10個

おわりに

Desktop 用のGPUには、SMの数によらず、Copy Engine が5個入っています。この部分は、Turning, Ampere, Ada まで変わっていないんでしょうかね。