cuda編程(2):軟硬件編程模型以及高效策略

原視頻 一、相關概念 多個線程組成線程塊,多個線程塊組成網格,網絡約等於kernel。而kernel是GPU處理的最小單元,可以理解成是一個函數。如下圖: CPU和GPU硬件對比: CPU和GPU編程: 二、高效策略 根據公式,有以下五種方式: 高效策略-合併全局內存 其他方式-避免線程發散: 其他方式-避免循環長度不一樣
相關文章
相關標籤/搜索