CUDA編程(三)評估CUDA程序的表現

CUDA編程(三) 評估CUDA程序的表現 上一篇博客咱們基本上搭建起來了CUDA程序的骨架,可是其中並無涉及到咱們以前不斷提到的並行加速,畢竟只有當咱們的程序高並行的運行在GPU上才能大大縮短運行時間。不過在加速以前咱們還有一件很是重要的事情須要考慮,那就是咱們的程序到底有沒有一個好的表現,也就是咱們要準確計算程序的運行時間,這對以後的程序優化也有相當重要的做用,因此值得咱們去仔細研究一下~cs
相關文章
相關標籤/搜索