CUDA學習筆記十

 Memory Access Patterns 大部分device一開始從global Memory獲取數據,並且,大部分GPU應用表現會被帶寬限制。所以最大化應用對global Memory帶寬的使用時獲取高性能的第一步。也就是說,global Memory的使用就沒調節好,其它的優化方案也獲取不到什麼大效果,下面的內容會涉及到很多L1的知識,這部分了解下就好,L1在Maxwell以後就不用
相關文章
相關標籤/搜索