CUDA學習(十)

內存映射: 在將原來的在CPU上運行的程序改爲到GPU上進行並行的程序時,主機與設備之間數據傳輸的時間的問題將被暴露出來,通常程序處理只需幾十毫秒甚至更少,但數據傳輸的時間將遠遠大於傳輸的時間,內存映射的方法能很好解決,不必傳輸數據。 通過將標誌cudaHostAllocMapped傳遞給cudaHostAlloc()或將標誌cudaHostRegisterMapped傳遞給cudaHostReg
相關文章
相關標籤/搜索