cuda程序以及硬件的映射

  一個網格中,多個塊,每個塊的大小和維度是一樣的,每個線程--->cuda core或者 sp(stream processor)  block-->SM。 SM 可以調度多個線程塊,一個kernel 的各個線程塊被分配多個SM, grid 是邏輯層 ,SM 是執行的物理層。每個SM 有自己的共享內存、寄存器 ,L1 cache 以及其他功能的硬件。一個程序的塊不能被映射到不同的SM上,一個bl
相關文章
相關標籤/搜索