CUDA實踐指南(三)

應用簡介: Profile: 許多代碼使用相對較少的代碼完成了大部分工作。 使用探查器,開發人員可以識別這些熱點,並開始編譯並行化候選列表。 創建配置文件: 有很多可能的方法來分析代碼,但在所有情況下,目標都是一樣的:識別應用程序花費其大部分執行時間的函數或函數。 (高優先級:爲了最大限度地提高開發人員的生產力,應用程序可以確定熱點和瓶頸。) 任何分析活動最重要的考慮是確保工作負載是現實的 - 即
相關文章
相關標籤/搜索