CUDA學習(二十五)

硬件實施(HARDWARE IMPLEMENTATION): NVIDIA GPU架構是圍繞可擴展的多線程流處理器(SM)陣列構建的。 當主機CPU上的CUDA程序調用內核網格時,網格塊被枚舉並分配給具有可用執行能力的多處理器。 一個線程塊的線程在一個多處理器上同時執行,多個線程塊可以在一個多處理器上同時執行。 當線程塊終止時,在空閒的多處理器上啓動新的塊。 多處理器被設計爲同時執行數百個線程。
相關文章
相關標籤/搜索