CUDA Handbook 補充 CPU和GPU硬件架構2

Latency Hiding = Latency tolerance         延遲隱匿又叫延遲容忍。通過在同一時間執行更多的warp來獲得更高的吞吐量,叫做延遲容忍。所謂warp就是一個線程區裏面一起執行的線程,一般是32個線程一起執行。它的意義是爲了「隱藏」延遲性,也就是說最大化利用GPU的計算功能,計算相對多了,數據傳輸則相對就小了(比如同樣執行100個操作,其中90個是計算,10個是
相關文章
相關標籤/搜索