CUDA學習(三十)

主機和設備之間的數據傳輸: 應用程序應儘量減少主機和設備之間的數據傳輸。 實現這一點的一種方法是將更多的代碼從主機移動到設備,即使這意味着運行低並行計算的內核。 中間數據結構可以在設備存儲器中創建,由設備操作,並且在沒有被主機映射的情況下被銷燬或被複制到主機存儲器。 而且,由於每次傳輸的開銷比較大,所以將多次小的傳輸轉換爲一次較大的傳輸比較好。 在具有前端總線的系統上,通過使用頁面鎖定主機內存中,
相關文章
相關標籤/搜索