顯卡里的cuda真正做到並行運算的機制和線程個數,主要關於SM、warp等概念。

前面扯了很多,不過大多都是在講CUDA 在軟體層面的東西;接下來,雖然Heresy 自己也不熟,不過還是來研究一下硬體的部分吧~畢竟要最佳化的時候,好像還是要大概知道一下相關的東西的。這部分主要參考資料是: [Hotball's Hive]GPU 的硬體架構 Programming Massively Parallel Processors的Lecture 7 在研究硬體架構前,可能須要先回去看《
相關文章
相關標籤/搜索