【CUDA編程】學習筆記(四) GPU存儲與優化

一、CPU內存 ●現代計算機體系結構面臨的主要挑戰 ✓如果數據無法快速移入和移出,那麼快速計算將毫無意義 ✓需要大量內存用於大型應用程序 ✓非常快的內存也非常昂貴 ●最終被推向分層設計 (1)CPU內存層次結構 ●執行速度依賴於利用數據局部性 ✓時間局部性:剛剛訪問的數據項很可能在不久的將來再次使用,因此請將其保留在緩存中 ✓空間局部性:相鄰數據也可能很快被使用,因此加載 它們使用「寬」總線(如多
相關文章
相關標籤/搜索