CUDA 6.0になって嬉しいのは、Unified Memoryではなく、
Visual ProfilerのGuided Performance Analysis。
Visual ProfilerのGuided Performance Analysis。
NVIDIAのCUDACastにもアップされました。
ちなみに、私の書いたCUDAコードをCUDA 6.0のVisual Profilerでチューニングしたら、
10%どころか30%以上も速くなったコードもありました(頑張っていないと言われればそれまでですが)
10%どころか30%以上も速くなったコードもありました(頑張っていないと言われればそれまでですが)
Visial Profilerを使ったことが無い?って言わないで、ぜひ使ってみてください。損はしませんから。