清華大學副教授都志輝講座筆記

第一版中,講MPI並行代碼直接用cuda重寫,一個月完成,發現有大量計算錯誤,並且不能排查。(結果不一樣原因就是移植的代碼錯了,因爲移植過程不可能完全想明白程序邏輯,總會有各種各樣的問題出來,這也是大型應用程序移植的難點) 第二版中的解決方法就是要做單元拆分。並且一直的時候分析代碼並重寫,寫成適合cuda計算的數據結構。 在能提升性能地方的代碼用cuda一直,沒有什麼提升餘地的地方用OpenACC
相關文章
相關標籤/搜索