GPU 並行結構層次

從程序上,GPU的並行層次依次爲 grid  block  wrap 每個kernel對應一個grid。wrap內的線程可以通過調度器來控制運行,一個wrap內的線程同時執行。wrap 的大小爲32,所有指定block 的大小時,最好是32的大小,以免造成資源的浪費。 每個線程有自己的local memory,一個block 內的線程共享share memory。啓動的block 越多,每個blo
相關文章
相關標籤/搜索