でもサンプルサイズが8192ぐらいにならないと、CPUより速くなりません。
32Kで5倍、64Kで9倍くらい。
32Kで5倍、64Kで9倍くらい。
最後に、
The performance will further improve with more optimization and future support of half-float.
とあるので、もっと速くなるのでしょう。きっと。
The performance will further improve with more optimization and future support of half-float.
とあるので、もっと速くなるのでしょう。きっと。