AlteraがCyclone V SoCでOpenCLを利用した事例を後悔しました。
FPGA Acceleration of Multifunction Printer Image Processing using OpenCL
FPGA Acceleration of Multifunction Printer Image Processing using OpenCL
その後、いくつかのチューニングをし、最後には、pipeという機能でカーネル間を接続し、メモリへの書き込みを減らし、トータルの処理時間を大幅に短縮したということ。
pipeという機能が威力を発揮した事例だと思います。