CUDA

CUDA(Compute Unified Device Architecture),顯卡廠商NVidia推出的運算平臺。 
隨着顯卡的發展,GPU愈來愈強大,並且GPU爲顯示圖像作了優化。在計算上已經超越了通用的CPU。如此強大的芯片若是隻是做爲顯卡就太浪費了,所以N卡廠商推出CUDA,讓顯卡能夠用於圖像計算之外的目的。
目前只有G80平臺的N卡才能使用CUDA,工具集的核心是一個C語言編譯器。G80中擁有128個單獨的ALU,所以很是適合並行計算,並且數值計算的速度遠遠優於CPU。
CUDA的SDK中的編譯器和開發平臺支持Windows、Linux系統,能夠與Visual Studio2003集成在一塊兒。
目前這項技術處在起步階段,僅支持32位系統,編譯器不支持雙精度數據等問題要在晚些時候解決。固然還有就是Geforce8系列顯卡高昂的價格問題了。
CUDA(Compute Unified Device Architecture)是一個新的基礎架構,這個架構可使用GPU來解決商業、工業以及科學方面的複雜計算問題。它是一個完整的GPGPU解決方案,提供了硬件的直接訪問接口,而沒必要像傳統方式同樣必須依賴圖形API接口來實現GPU的訪問。在架構上採用了一種全新的計算體系結構來使用GPU提供的硬件資源,從而給大規模的數據計算應用提供了一種比CPU更增強大的計算能力。CUDA採用C語言做爲編程語言提供大量的高性能計算指令開發能力,使開發者可以在GPU的強大計算能力的基礎上創建起一種效率更高的密集數據計算解決方案。
從CUDA體系結構的組成來講,包含了三個部分:開發庫、運行期環境和驅動(表2)。
開發庫是基於CUDA技術所提供的應用開發庫。目前CUDA的1.1版提供了兩個標準的數學運算庫——CUFFT(離散快速傅立葉變換)和CUBLAS(離散基本線性計算)的實現。這兩個數學運算庫所解決的是典型的大規模的並行計算問題,也是在密集數據計算中很是常見的計算類型。開發人員在開發庫的基礎上能夠快速、方便的創建起本身的計算應用。此外,開發人員也能夠在CUDA的技術基礎上實現出更多的開發庫。
運行期環境提供了應用開發接口和運行期組件,包括基本數據類型的定義和各種計算、類型轉換、內存管理、設備訪問和執行調度等函數。基於CUDA開發的程序代碼在實際執行中分爲兩種,一種是運行在CPU上的宿主代碼(Host Code),一種是運行在GPU上的設備代碼(Device Code)。不一樣類型的代碼因爲其運行的物理位置不一樣,可以訪問到的資源不一樣,所以對應的運行期組件也分爲公共組件、宿主組件和設備組件三個部分,基本上囊括了全部在GPGPU開發中所須要的功能和可以使用到的資源接口,開發人員能夠經過運行期環境的編程接口實現各類類型的計算。
因爲目前存在着多種GPU版本的NVIDIA顯卡,不一樣版本的GPU之間都有不一樣的差別,所以驅動部分基本上能夠理解爲是CUDA-enable的GPU的設備抽象層,提供硬件設備的抽象訪問接口。CUDA提供運行期環境也是經過這一層來實現各類功能的。目前基於CUDA開發的應用必須有NVIDIA CUDA-enable的硬件支持,NVIDIA公司GPU運算事業部總經理Andy Keane在一次活動中表示:一個充滿生命力的技術平臺應該是開放的,CUDA將來也會向這個方向發展。因爲CUDA的體系結構中有硬件抽象層的存在,所以從此也有可能發展成爲一個通用的GPGPU標準接口,兼容不一樣廠商的GPU產品

CUDA™ 工具包是一種針對支持CUDA功能的GPU(圖形處理器)的C語言開發環境。CUDA開發環境包括:
· nvcc C語言編譯器
· 適用於GPU(圖形處理器)的CUDA FFT和BLAS庫
· 分析器
· 適用於GPU(圖形處理器)的gdb調試器(在2008年3月推出alpha版)
· CUDA運行時(CUDA runtime)驅動程序(目前在標準的NVIDIA GPU驅動中也提供)
· CUDA編程手冊
CUDA開發者軟件開發包(SDK)提供了一些範例(附有源代碼),以幫助使用者開始CUDA編程。這些範例包括:
· 並行雙調排序
· 矩陣乘法
· 矩陣轉置
· 利用計時器進行性能評價
· 並行大數組的前綴和(掃描)
· 圖像卷積
· 使用Haar小波的一維DWT
· OpenGL和Direct3D圖形互操做示例
· CUDA BLAS和FFT庫的使用示例
· CPU-GPU C—和C++—代碼集成
· 二項式期權訂價模型
· Black-Scholes期權訂價模型
· Monte-Carlo期權訂價模型
· 並行Mersenne Twister(隨機數生成)
· 並行直方圖
· 圖像去噪
· Sobel邊緣檢測濾波器
· MathWorks MATLAB® 插件 (點擊這裏下載)
新的基於1.1版CUDA的SDK 範例如今也已經發布了。要查看完整的列表、下載代碼,請點擊此處。
技術功能
· 在GPU(圖形處理器)上提供標準C編程語言
· 爲在支持CUDA的NVIDIA GPU(圖形處理器)上進行並行計算而提供了統一的軟硬件解決方案
· CUDA兼容的GPU(圖形處理器)包括不少:從低功耗的筆記本上用的GPU到高性能的,多GPU的系統。
· 支持CUDA的GPU(圖形處理器)支持並行數據緩存和線程執行管理器
· 標準FFT(快速傅立葉變換)和BLAS(基本線性代數子程序)數值程序庫
· 針對計算的專用CUDA驅動
· 通過優化的,從中央處理器(CPU)到支持CUDA的GPU(圖形處理器)的直接上傳、下載通道
· CUDA驅動可與OpenGL和DirectX圖形驅動程序實現互操做
· 支持Linux 32位/64位以及Windows XP 32位/64位 操做系統
· 爲了研究以及開發語言的目的,CUDA提供對驅動程序的直接訪問,以及彙編語言級的訪問
相關文章
相關標籤/搜索