《OpenACC並行程序設計:性能優化實踐指南》一 2.6 小結

2.6 小結 OpenACC是一種描述型並行編程模型。在本章中,通過一個測試函數的應用,使用了OpenACC的多種特性來描述並行度和數據操控,並針對特定平臺對代碼進行了優化。儘管使用的是PGI編譯器和PGProf性能調試器,但類似的優化流程也是適用於任何支持OpenACC工具包的應用的。 1.獲得應用程序的性能分析結果,辨識和挖掘代碼中的可並行之處。 2.逐步向編譯器描述代碼中可挖掘出的並行性。如
相關文章
相關標籤/搜索