CUDA精講(4)-- 性能優化

通信 vs 計算 Kepler架構來說,其峯值處理性能達到了3900Gflops,而其帶寬只有250GB/s,約等於63Gflops。計算/通信約等於60。也就是說我們編寫的程序達到的計算/通信極限是60左右,一般來說很難達到這個數值,但是我們需要朝着這個目標而努力。 計算/通信比還有一個叫法:Compute to Global Memory Access(CGMA)ratio。 具體來說,執行一
相關文章
相關標籤/搜索