Nsight Compute 使用

記錄使用Nsight Compute 分析CUDA程序性能的步驟。 1.單擊菜單欄上的Connet,彈出如下界面,設置要剖析的執行程序路徑等運行相關參數;選擇Interactive Profile模式,可以對剖析流程進行控制;所有參數設置完成後,單擊Launch開始性能分析。 2.在API Stream頁面控制剖析軟件執行到目標核函數,然後單擊菜單欄的 Profile Kernel對核函數進行剖析
相關文章
相關標籤/搜索