【CUDA】CUDA編程:內核kernel

內核使用__global__聲明符定義,使用<<<...>>>執行配置語法指定執行某一指定內核的線程數。每個執行內核的線程擁有一個獨一無二的線程ID,經過內置的變量threadIdx訪問。線程 下面的例子是將兩個長度爲N的向量A和B相加,並將結果存入向量C中。code __global__ void VecAdd(float* A, float* B, float* C) { int i
相關文章
相關標籤/搜索