【IT168 案例】 通過多年的嘗試,圖形處理單元(GPU)開始受到主流服務器廠商的重視,做爲第一批在高性能計算(HPC)上採用GPU的一線服務器廠商,戴爾的應用和解決方案更有其獨到之處。爲進一步瞭解戴爾 GPU解決方案的特色及創新技術,IT168記者採訪戴爾高性能計算高級顧問凌巍才。php
GPU計算適合哪些應用?web
GPU計算誕生之初,主要做爲電子遊戲等高速圖形加速器,但服務器廠商很快發現它除了在遊戲渲染方面有出色的表現外,在科學算方面也有先天性優點。服務器
凌巍才談道,帶有GPU的混合架構的並行計算是高性能計算髮展的趨勢。高性能計算髮展的最初,是一些大型的主機,CPU共享內存; 90年代末,基於Linux Cluster技術出現;最近幾年,利用GPU進行科學計算成爲一種新的發展趨勢。網絡
他指出, GPU是徹底脫離開CPU的計算架構,計算核數很是多。一個CPU一般只有4核、6核、8核或者16個核,而在GPU裏,Tesla一個卡上面就有448個核,因此GPU和CPU在物理架構上不一樣,這致使應用程序在不一樣架構上面跑的時候也有不一樣的特性。架構
GPU計算核數很是多,如一個Tesla M2075 的GPU卡有448個核,內存6GB,比較適合數據集不是很大、可是並行很是多的應用,好比基因序列比對等。ide
CPU處理的內存很大,有的達到512GB,甚至2TB,核數如今一般有4核、6核、8核等,不少個處理器在一塊兒運行,這類架構比較適合數據集比較大、很差分塊處理但有必定並行度的應用軟件,好比說基因拼裝等應用軟件。性能
推薦閱讀:HPC社區測試
DELL GPU計算解決方案三大特點優化
和戴爾其餘高性能計算解決方案同樣,Dell的GPU計算解決方案也是遵循着開放、高效且高性價的原則。「開放「指的是戴爾要和業界其餘廠商進行合做,爲用戶提供最好的解決方案,用戶能夠根據本身的須要來選擇合適的方案,同時能夠靈活擴展;」高效「是指戴爾提供的方案要正好知足用戶的須要,從節能,簡化管理和自動化等各個方面爲客戶下降整體擁有成本;」高性價比」是由於戴爾大量使用了標準化、通用化的技術,經過規模化生產下降客戶成本。凌巍才表示,儘管目前幾乎百分之百的OEM廠商都已經支持GPU計算,但戴爾做爲GPU計算的首批嘗試者,在GPU計算領域已經造成了本身的特點,主要體如今三個層面:雲計算
首先,DELL在GPU計算方面擁有很全的產品系列,能夠爲用戶提供普遍的選擇:一種是直接把GPU安裝在機箱裏,另外一種是經過PCI卡來與GPU互連,第三種是提供專門的GPU服務器,好比新推出的C410x擁有16個GPU。戴爾不僅是提供一種產品,而提供多種方案來供用戶按照本身的需求進行選擇。戴爾的產品涵蓋支持GPU計算的刀片服務器M610x、工做站、機架式服務器和雲計算服務器PEC,以及DELL 特有的C410X GPU擴展箱等等。
其次,DELL和領先的廠商合做與用戶提供完整開放標準的解決方案,這些合做夥伴包括英特爾、AMD、Qlogic、Mellanox、Microsoft、Red Hat等。
另外,DELL在生命科學、石油勘探等領域都有相應的技術專家,能夠爲行業用戶提供GPU應用軟件的測試,並進行調優。
DELL在GPU方面的創新:獨立的GPU擴展箱
除了提供基於GPU計算工做站、刀片服務器、機架式服務器以外,DELL還推出了一款新的方案:把GPU單獨的放在一個GPU擴展箱裏,而且這個擴展箱只放GPU卡,最多能夠放16塊,而後經過一個叫作HIC的接口卡鏈接到主機上面來運行。這樣的解決方案有不少優勢,其中很重要的一點是配置很是靈活,GPU的個數能夠支持多達1至8臺服務器和1至16個GPU卡,用戶能夠根據應用的環境靈活地選擇:1:一、1:二、1:三、1:4 等多種一帶多的方案。
一對多環境下的GPU測試結果
咱們知道,應用程序若是能夠在GPU上運行,那麼,在多個GPU上運行時,能夠增長計算的並行運行效率。日前,DELL跟一些行業客戶合做,針對行業應用進行了一對多的GPU測試,也就是在一臺主機帶多個GPU來運行測試程序,並記錄隨着GPU數量的增長運行速度的增加狀況。
主要測試了兩類應用:一類生命科學裏面基因序列分析應用—GPU-HMMER程序,測試結果顯示,GPU數量爲一、2和4個GPU的時候,速度基本上是線性增加的;還有一類是分子動力學(Molecular Dynamics,MD)應用——NAMD程序,測試環境是一個八個節點的InfiniBand集羣,每一個節點帶兩個GPU,測試結果代表它的線性增加很好。
如何應對ExaScale計算時代?
ExaScale已經成爲高性能計算領域的一個不可避免的趨勢,然而,隨着計算規模的不斷擴大,應用程序的可移植性、成本以及能耗等問題成爲高性能計算用戶心中永恆的痛。凌巍才表示,DELL將在平臺開放性、下降產品價格、能耗優化等角度,幫助用戶邁向ExaScale時代。
基於開放平臺提供全面的解決方案。經過提供一個開放的平臺和功能強大的產品系列和解決方案,凌巍才強調,服務器產品、網絡產品和存儲產品等全部的這些產品都採用開放的技術和產品,這樣,用戶就能夠比較容易地基於這個開放進行應用程序的移植或二次開發。
下降產品成本。設備都是領先的產品和技術,包括英特爾和AMD的處理器、NVDIA的GPU卡、以及Infiniband技術,還有一些新的軟件,並在這個基礎上儘可能下降產品的價格,向用戶提供一整套的解決方案。
能耗優化。ExaScale計算時代的能耗問題是一個十分嚴峻的問題,DELL從系統角度進行能耗的優化,也提供了不少節能的技術和產品。好比,機架式服務器方面,DELL第11代服務器設計時專門針對CPU內存硬盤供電,因此在供電方面很是節能;在刀片上面也有能耗優化的設計,平均比其它的刀片產品在有工做負載的狀況下能夠節省25%的能耗;此外,C410X的GPU 箱採用了單獨供電、散熱等技術,其服務器就是經過一個或多個數據線連起來的,因爲服務器和GPU擴展箱都是單獨供電的,因此很是節能。
對GPU開發者的建議
凌巍才介紹道,一對多的模式的開發是一個趨勢。如今有不少應用、軟件均可以在網上下載,這些軟件不少尚未GPU的版本。網友想使用GPU計算的話,能夠先基於一些開源軟件,或者基於已經有的軟件進行二次開發,看看是否能夠在多個GPU上運行,性能的加速好比何。
另外一方面,基於GPU的集羣計算也是一個發展方向,他建議有興趣的網友能夠把一些又實用價值的軟件移植到GPU的集羣上來,好比一些搜索、比對等並行度高的應用。
更多精彩文章請關注: