「X戰警」到來,百度重磅發佈自主研發的超級AI計算平臺X-MAN3.0

「X戰警」到來,百度重磅發佈自主研發的超級AI計算平臺X-MAN3.0算法

12月2日,在加拿大舉行的第32屆NIPS神經信息處理系統大會上,百度正式發佈自主研發的超級AI計算平臺X-MAN3.0。該平臺專爲AI深度學習場景優化設計,每秒完成2000萬億次深度神經網絡計算,極大的加快了AI深度學習模型的訓練速度。服務器

NIPS做爲機器學習和神經計算領域的頂級會議,吸引了機器學習、人工智能、統計等領域的衆多國際專家參與。近年來,在計算機視覺、語音識別、天然語言處理等領域也出現了大量的創新應用,NIPS在AI深度學習領域的學術影響力變得舉足輕重。網絡

clipboard.png

算法、數據和計算是推進AI深度學習技術快速發展的三大要素。爲支持更強的泛化能力,更高的預測精度,算法模型日趨複雜,愈來愈多的數據須要被及時標註和處理,計算性能成爲關鍵。百度X-MAN超級AI計算平臺提供極致的計算性能,支持超大複雜算法模型,可以快速及時處理海量數據。自2016年誕生以來,百度X-MAN超級AI計算平臺歷經3代發展,3次架構升級,創造6項業界第一,同時期關鍵技術&性能保持領先,引領行業發展趨勢。目前,X-MAN系列產品已在百度大規模應用,正在助力百度AI戰略快速落地。架構

clipboard.png

X-MAN解決的3大關鍵技術挑戰
爲提供更強的計算性能和最佳的計算效率,X-MAN在系統設計中面臨了三大關鍵技術的挑戰:如何有效提高單機計算性能、如何實現多機加速的高可擴展性以及如何均衡CPU與AI加速芯片的配比關係,以免系統瓶頸。機器學習

在有限的單機空間內,集成更多數量、性能更強、互聯帶寬更高的AI加速卡,是提高單機計算性能的直接手段,但帶來了高速互聯、結構、散熱、供電等硬件技術難題;單機訓練方式難以知足超大規模數據集和複雜的模型場景下的計算力需求,大規模分佈式訓練成爲必然,解決多機加速的可擴展性就成了關鍵技術難題;深度學習模型的負載差別較大,CPU密集型,計算密集型,通訊密集型,存在着多種需求場景,爲了不繫統性能瓶頸、充分發揮計算效率,如何快速靈活的調整CPU和AI計算芯片的配比並支持獨立迭代升級成了關鍵的技術難題。分佈式

X-MAN的3次架構升級和9大技術特徵
自2016年首次發佈以來,X-MAN的三代產品各自都有着鮮明的設計理念:超高的計算密度、高效散熱、兼容多元化AI加速芯片。X-MAN經過3次架構升級,有效攻克了3大技術挑戰。模塊化

X-MAN1.0發佈於2016年Q2,單機能夠支持16個AI加速卡,最高擴展到64,實現了超高的計算密度。X-MAN1.0具有4大技術特徵:硬件解耦、資源池化、PCIe Fabric技術、100G RDMA高速互聯。性能

X-MAN2.0發佈於2017年Q3,經過冷板式液冷散熱技術實現了超高的散熱效率。和業界主流方案同樣,X-MAN2.0能夠支持8卡NVLink高速互聯,差別化方面,X-MAN2.0具有2大技術特徵:液冷散熱和靈活的IO支持。學習

隨着AI人工智能技術的快速發展,衆多AI芯片公司應運而生,AI芯片格局正呈現多元化發展趨勢。這次NIPS大會上發佈的X-MAN3.0,採用了硬件系統模塊化、互聯接口標準化、互聯拓撲高靈活性的設計思路,既提高了多元化AI加速芯片的兼容性,也促進了AI加速芯片生態健康、快速、可持續的發展。X-MAN3.0具有3大關鍵技術特徵,包括48V供電技術、標準化的AI加速卡接口定義和靈活的互聯拓撲。優化

這次百度快速研發落地X-MAN3.0,獲得了浪潮、英業達等服務器系統廠商的積極參與支持; 咱們期待有更多的服務器系統合做夥伴、AI加速芯片廠商和同行加入共建開放的生態,促進整個生態圈的良性發展。

clipboard.png
X-MAN1.0

clipboard.png
X-MAN2.0

clipboard.png
X-MAN3.0

X-MAN創造了6項業界第一,引領行業技術發展趨勢
憑藉着對AI業務模型的深入理解、紮實的硬件基礎架構技術和對行業趨勢的準確預判,百度設計了X-MAN AI計算平臺系列產品,創造了6項業界第一。其中, 2016年Q2發佈的X-MAN1.0創造了5個業界第一:首次實現單機擴展16片AI加速卡;首次實現4/8/16/32/64卡系統級彈性擴展;首次實現AI計算硬件解耦架構(注:Facebook 2017年Q1發佈的Big Basin、微軟2017年Q1發佈的HGX-1等都採用了類似設計理念);首次實現PCIe Fabric技術架構,支持按需求業務動態分配AI計算資源;首次實現虛擬機多卡高速無損通訊技術(native performance)。2017年Q3發佈的X-MAN2.0業界獨創將冷板式液冷散熱技術應用到AI計算產品裏,有效解決了高性能AI加速卡的散熱挑戰(注:Google 2018年Q2發佈的TPU3.0也採用了類似技術)。

X-MAN大規模部署,助力百度AI戰略快速落地憑藉着強大的單機計算性能、業界領先的多機擴展性、靈活的AI計算資源動態分配調整能力,X-MAN系列產品已在百度實現規模化部署,普遍應用於語音識別、計算機視覺、天然語音處理、無人車等基礎AI技術的深度學習模型訓練,將訓練時間從周級別縮短到天級別;服務於百度DuerOS、Apollo、ABC Cloud等核心業務,助力百度AI戰略的快速落地。

相關文章
相關標籤/搜索