【並行計算10】GPU ARCHITECTURE

Thread execution Execution model Warp Warp Divergence 減少branch結構 爲什麼是2是保證了if和else的情況 減少判斷的次數,unroll Memory hierarchy local variable不一定非常快哦! Register&Local memory 一個block中thread越多,則local variable會被擠出到g
相關文章
相關標籤/搜索