CUDA Handbook 補充 CPU和GPU硬件架構2

時間 2021-07-10

原文原文鏈接

Latency Hiding = Latency tolerance 延遲隱匿又叫延遲容忍。通過在同一時間執行更多的warp來獲得更高的吞吐量，叫做延遲容忍。所謂warp就是一個線程區裏面一起執行的線程，一般是32個線程一起執行。它的意義是爲了「隱藏」延遲性，也就是說最大化利用GPU的計算功能，計算相對多了，數據傳輸則相對就小了（比如同樣執行100個操作，其中90個是計算，10個是

>>阅读原文<<