《CUDA C編程權威指南》—讀書筆記—3.1CUDA執行模型與硬件

軟硬總歸是不能分家。上一章簡單介紹了CUDA的編程模型,本章學習主要關於CUDA的相關硬件架構、線程執行的本質,以及CUDA在線程級並行的一些優化方法,比如規約問題。話不多數,開始學習。 GPU實際上是由多個流式多處理器構建的處理器陣列(可以這樣理解,當然所有SM會由GPU管理,並非完全獨立)。先上一張經典Fermi架構的GPU的SM示意圖。需要注意的是,以下結構實際上只是 GPU的compute
相關文章
相關標籤/搜索