《CUDA C編程權威指南》——2.2節給核函數計時

本節書摘來自華章社區《CUDA C編程權威指南》一書中的第2章,第2.2節給核函數計時,作者[美] 馬克斯·格羅斯曼(Max Grossman) ,更多章節內容可以訪問雲棲社區「華章社區」公衆號查看 2.2 給核函數計時 在內核的性能轉換過程中,瞭解核函數的執行需要多長時間是很有幫助並且十分關鍵的。衡量核函數性能的方法有很多。最簡單的方法是在主機端使用一個CPU或GPU計時器來計算內核的執行時間。
相關文章
相關標籤/搜索