2015-01-24 CUDA 7のStream NVIDIA/CUDA #ソフトウェア @Vengineerの戯言 : Twitter SystemVerilogの世界へようこそ、すべては、SystemC v0.9公開から始まった GPU Pro Tip: CUDA 7 Streams Simplify Concurrencyによると、CUDA 7でのDefault Streamをスレッド単位に割り当てられるようになっているようです。 カーネルが並列しているように見えます。すべてのカーネルが並列に動き、最終的に速く実行しているかまでは分かりませんが。 pthreadを使って並列動作される場合の例では、この機能を使えばスレッド内で各カーネルが並列で動くようです。この例でも同じように、速く実行できるかまでは確認できませんが。。。