CUDA之Thread、Wrap執行詳解

從硬件角度分析,支持CUDA的NVIDIA 顯卡,都是由多個multiprocessors 組成。每個 multiprocessor 裏包含了8個stream processors,其組成是四個四個一組,也就是兩組4D的處理器。每個 multiprocessor 還具有 很多個(比如8192個)寄存器,一定的(比如16KB) share memory,以及 texture cache 和 cons
相關文章
相關標籤/搜索