GPU中的SM和wrap的關係

介紹 我們在cpu上做好了準備工作,然後將指令發送給GPU, 在這裏我們看到grid爲10,block爲128,也就說有10個block,每一block有128個thread, 如何分配這些block? 原則 在GPU中一個block是不能拆分到兩個SM中 一個SM中的block要滿足SM的條件限制 SM有哪些限制? 簡單有這些,當然還有其他的沒有展示,這裏數值都是我瞎編的,具體的可以去官網文檔查
相關文章
相關標籤/搜索