GPU程序优化(一)——基本概念
https://zyddora.github.io/2016/03/25/gpu-optimization-1/
GPU程序优化(二)——矩阵转置程序优化实例
https://zyddora.github.io/2016/03/26/gpu-optimization-2/
GPU程序优化(三)——矩阵转置程序优化实例(进阶版)
https://zyddora.github.io/2016/03/27/gpu-optimization-3/
GPU程序优化(四)——系统级别的优化
https://zyddora.github.io/2016/03/27/gpu-optimization-4/