CUDA 程序的優化(1) 概述

CUDA程序優化的最終目的,是以最短的時間,在允許的誤差範圍內完成給定的計算任務。在這裏,「最短的時間」是指整個程序的運行時間,更側重於計算的吞吐量,而不是單個數據的延遲。在開始考慮使用GPU和CPU協同計算之前,應該先粗略地評估使用CUDA是否能達到預想的效果,包括以下幾個方面: 1.精度 目前,GPU的單精度計算性能要遠遠超過雙精度計算性能,整數乘法、除法、求模等運算的指令吞吐量也較爲有限。在
相關文章
相關標籤/搜索