CUDA學習——Chapter 3(6)並行性實驗(2)

第三章 加載吞吐量實驗 上個實驗介紹的是如何通過nvprof來檢測SM上的佔用率,現在我們來簡述一下吞吐量是怎麼檢測的。 命令:nvprof --metrics gld_throughput <program> [param1] [param2] … 第一種情況:32*32的線程塊大小: 第二種情況:32*16的線程塊大小: 第三種情況:16*32的線程塊大小: 第四種情況:16*16的線程塊大小
相關文章
相關標籤/搜索