《OpenACC並行程序設計:性能優化實踐指南》一 3.6 第一個並行PIConGPU實現

3.6 第一個並行PIConGPU實現 下一步,用Vampir打開追蹤文件trace.otf2,如圖3-8所示。追蹤縮略圖(右上角)顯示只選擇了整個程序執行的0.2s,並且重複模式顯示了模擬的大概2.5個迭代步驟。中間用顏色編碼的活動是主時間軸,它顯示了MPI、主機進程(進程1~4)和相應的CUDA上下文(線程1/1-4)。右下角的圖例顯示了顏色的含義。進程之間的黑線代表MPI消息。進程和線程之間
相關文章
相關標籤/搜索