はじめに NVIDIAの下記の論文を見直して、気が付きました。 GPU Domain Specialization via Composable On-Package Architecture GPGPUのL3 Cacheって、LLMの性能にどのような影響を与えるのか? グラフを見てみたら、 下図は上記の論文の Figure 9 です。こ…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。