《CUDA C編程權威指南》——3.3節並行性的表現述

本節書摘來自華章社區《CUDA C編程權威指南》一書中的第3章,第3.3節並行性的表現述,作者[美] 馬克斯·格羅斯曼(Max Grossman) ,更多章節內容可以訪問雲棲社區「華章社區」公衆號查看 3.3 並行性的表現 爲更好地理解線程束執行的本質,將使用不同的執行配置分析下述的sumMatrixOn-GPU2D核函數。使用nvprof配置指標,可以有助於理解爲什麼有些網格/塊的維數組合比其他
相關文章
相關標籤/搜索