清華大學副教授都志輝講座筆記

時間 2021-01-11

標籤 HPC CUDA 简体版

原文原文鏈接

第一版中，講MPI並行代碼直接用cuda重寫，一個月完成，發現有大量計算錯誤，並且不能排查。（結果不一樣原因就是移植的代碼錯了，因爲移植過程不可能完全想明白程序邏輯，總會有各種各樣的問題出來，這也是大型應用程序移植的難點）第二版中的解決方法就是要做單元拆分。並且一直的時候分析代碼並重寫，寫成適合cuda計算的數據結構。在能提升性能地方的代碼用cuda一直，沒有什麼提升餘地的地方用OpenACC

>>阅读原文<<

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。