CUDA學習--矩陣乘法的並行運算

1. CUDA學習步驟 CPU實現 a*b = c 的矩陣乘法(矩陣尺寸是n*m的,n和m大於1000) 下載 https://developer.nvidia.com/cuda-downloads,安裝好cuda 將cpu代碼移植到cuda。將CPU值傳入GPU,使用cuda計算,與cpu結果對比。 優化思路1:將矩陣分塊進行計算 優化思路2:使用share memory進行優化 優化思路3:將
相關文章
相關標籤/搜索