《OpenACC並行程序設計:性能優化實踐指南》一 3.7 釋放主機進程

3.7 釋放主機進程 下一個PIConGPU改進版本解決了已知問題,並引入了一個額外的Pthread來處理MPI通信活動(線程1-4:2)。如圖3-9所示,這釋放了主機進程,使其在GPU所需數據可用後立即向GPU發射任務,同時儘快地與周邊的進程通信交換數據。由於Infiniband結構減少了消息延時,因此總體GPU使用率有所提高。
相關文章
相關標籤/搜索