Udacity cs344-Introduction to Parallel Programming筆記(超詳細,CUDA,並行,GPU)---Unit 5

1.優化的等級 2.應該有一個系統化的優化過程(類似於一個優化的週期,缺少哪一步效果都不好) 在真實數據集上跑很重要 不要「真空」優化 別忘了 思考你到底想實現啥 和在現實世界中執行收到反饋 3.具體過程 a.分析 4.強縮放和弱縮放 弱縮放:時間不變,問題數量增多 強縮放:問題不變,時間縮短     5.分析 瞭解熱點 Amdah's law     6.並行化 用GPU做矩陣轉置 分配空間調用
相關文章
相關標籤/搜索