2019年3月19日,阿里雲RDS PostgreSQL數據庫GPU規格版本正式上線,開啓了RDS異構計算並行加速之路。該版本在RDS(關係型數據庫服務)的雲基礎設施層面首次完成了與阿里雲異構計算產品的適配,實現了PostgreSQL時空引擎Ganos在空間圖形圖像處理上的並行計算加速,成爲國內第一個將GPU應用於商業空間信息領域的數據庫。算法
GPU(Graphic Processing Unit)是一種高並行架構圖形處理器,其最突出的特色就是計算核心多,相比傳統CPU四個、八個等計算核心, GPU的計算核心能夠多達到幾千個,加上數據高速緩存和流控制,這樣的結構很是適合對計算密集型且易於並行處理的數據進行計算加速。GPU最初是被設計用來專門處理並行圖形計算問題的,近年來,隨着GPU在人工智能和高性能計算領域應用愈來愈多,GPU已經成了更強大且更廣義的處理器代名詞。數據庫
伴隨該版本的發佈,RDS在雲基礎設施層面首次完成了GPU計算框架的適配,爲雲上數據庫構建異構計算並行環境創建了重要基礎。因爲空間圖形圖像數據體量大、計算複雜,首期GPU加速能力主要與阿里雲數據庫時空引擎 Ganos結合,大幅提高空間數據處理性能。PostgreSQL時空引擎 Ganos爲一種雲數據庫增值服務,爲各種時空數據提供雲上的高效存儲、查詢和分析計算服務。緩存
系統提供了CPU與GPU異構計算框架,能自動檢測GPU環境,並創建基於規則的優化方法選擇評估CPU計算、GPU計算或混合計算,用戶作到無感知。在空間計算方面,創建了GIS空間並行模型(如柵格數據的Raster-Chunk-Cell框架)與CUDA(顯卡廠商NVIDIA推出的運算平臺)並行模型的最佳適配,達到減小GPU任務調度,最大化利用GPU資源的目的。架構
2.1 空間數據加速上雲框架
空間柵格型數據(遙感影像、高程模型等)分幅數多,體量大,上雲速度慢。經過改良基礎算法提升雲數據庫寫入速度是用戶比較關心的應用場景。以柵格數據的重採樣算法爲例,三次卷積採樣以及更高級的重採樣算法成像質量好,但運算量會成倍增長。所以,提高基礎算法的處理效率是加快柵格數據處理應用的關鍵。按輸出10000*10000像素大小的遙感影像數據來計算,須要獨立運行1億次採樣算法,屬於計算密集型操做,且柵格數據呈矩陣模型,可充分利用GPU並行加速能力提升重採樣效率。性能
在遙感空間應用中,因數據來源或採集方式不一樣,每每存在座標系統不一致的情形。當須要疊加統一顯示時,要麼事先轉成同一座標系,要麼進行實時動態投影。前者會存在數據冗餘問題,然後者更爲高效,但每每因動態投影計算量大,在CPU環境下每每很難達到實時顯示效果。經過GPU並行計算提高動態投影計算效能可解決這一問題。測試
隨着互聯網出行、位置感知技術的快速發展,移動對象(飛機、船、車、行人等)產生的數據量愈來愈多,大量的軌跡數據的接入、更新和顯示,給數據傳輸和存儲帶來很大的挑戰。經過藉助GPU並行計算能力,對移動對象的軌跡數據進行實時動態抽稀處理,可達到減小存儲量、快速傳輸顯示的目的。優化
經對比測試,以遙感影像三次卷積重採樣純算法加速爲例,GPU並行計算較CPU平均提高50倍左右,且隨數據量越大、計算越複雜,提高效果越明顯。從全鏈路角度,當數據存儲在SSD雲盤時,遙感影像入庫(含索引建立)GPU較CPU快9-15倍;當數據存儲在OSS(Object Storage Service,對象存儲服務)時,數據入庫全流程GPU較CPU加速4-7倍。阿里雲
阿里雲RDS for PostgreSQL數據庫GPU規格版本已經在公有云上線,目前僅在華東2(上海)開放。用戶購買時,請選擇PG10基礎版,並在規格欄選擇GPU加速機型,系統已經默認帶有GPU環境。用戶使用時不須要設置任何參數便可體驗GPU加速計算帶來的性能體驗。人工智能
原文連接 本文爲雲棲社區原創內容,未經容許不得轉載。