CUDA全局內存-對齊與合併

CUDA執行模型的特徵之一指令都是以線程束爲單位進行發佈和執行,存儲操作也是如此。 通常情況下,如圖所示,全局內存是通過緩存進行加載,而加載請求是通過所謂「內存事務」來實現的,「內存事務」分爲32字節和128字節兩種。要麼一次性加載32字節,要麼一次性加載128字節,這主要取決於設備的緩存路徑。 如果對全局內存的訪問使用L1/L2緩存存儲(路徑1),那麼訪問必須由128字節的「內存事務」完成,因此
相關文章
相關標籤/搜索