GPU對CNN計算的加速原理究竟是怎樣的?

具體到cnn,利用gpu加速主要是在conv(卷積)過程上。conv過程同理能夠像以上的向量加法同樣經過cuda實現並行化。具體的方法不少,不過最好的仍是利用fft(快速傅里葉變換)進行快速卷積。NVIDIA提供了cufft庫實現fft,複數乘法則能夠使用cublas庫裏的對應的level3的cublasCgemm函數。再具體到各大框架是如何使用gpu對cnn進行加速的,目前主流的作法是使用NVI
相關文章
相關標籤/搜索