CUDA學習(八十六)

計算能力6.x: 多處理器由以下部分組成: 64(計算能力6.0)或128(6.1和6.2)用於算術運算的CUDA內核 用於單精度浮點超越函數的16(6.0)或32(6.1和6.2)特殊功能單元, 2(6.0)或4(6.1和6.2)warp調度程序。 當一個多處理器被執行時,它首先在它的調度器中進行分配。 然後,在每個指令發佈時間,每個調度程序爲其分配的一個warp指令發出一條指令,如果有的話,該
相關文章
相關標籤/搜索