CUDA:並行計算實現矩陣相加

(一)目的 熟悉基本的CUDA程序架構以及如何調用相應的API進行CUDA編程   (二)內容 完成矩陣相加的並行程序的實現(不用share memory實現) 要求: 實現2個矩陣(32*32)的相加,M矩陣的初始值全爲2,N矩陣的初始值全爲5。同時用CPU代碼實現,比較兩個代碼的運行時間 實現2個矩陣(1024*1024)的相加,M矩陣的初始值全爲2,N矩陣的初始值全爲5。同時用CPU代碼實現
相關文章
相關標籤/搜索