《CUDA C編程權威指南》——3.3 並行性的表現

本節書摘來自華章計算機《CUDA C編程權威指南》一書中的第3章,第3.3節,作者 [美] 馬克斯·格羅斯曼(Max Grossman),譯 顏成鋼 殷建 李亮,更多章節內容可以訪問雲棲社區「華章計算機」公衆號查看。 3.3 並行性的表現 爲更好地理解線程束執行的本質,將使用不同的執行配置分析下述的sumMatrixOn-GPU2D核函數。使用nvprof配置指標,可以有助於理解爲什麼有些網格/塊
相關文章
相關標籤/搜索