GPU 共享內存地址映射方式

當一個warp中的不同線程訪問一個bank中的不同的字地址時,就會發生bank衝突。 如果沒有bank衝突的話,共享內存的訪存速度將會非常的快,大約比全局內存的訪問延遲低100多倍,但是速度沒有寄存器快。然而,如果在使用共享內存時發生了bank衝突的話,性能將會降低很多很多。在最壞的情況下,即一個warp中的所有線程訪問了相同bank的32個不同字地址的話,那麼這32個訪問操作將會全部被序列化,大
相關文章
相關標籤/搜索