單顆GPU計算能力太多、太貴?阿里雲發佈雲上首個輕量級GPU實例

摘要: 阿里雲發佈了國內首個公共雲上的輕量級GPU異構計算產品——VGN5i實例,該實例打破了傳統直通模式的侷限,能夠提供比單顆物理GPU更細粒度的服務,從而讓客戶以更低成本、更高彈性開展業務。html

在硅谷舉辦的2019年NVIDIA GPU技術大會(GTC)上,阿里雲發佈了國內首個公共雲上的輕量級GPU異構計算產品——VGN5i實例,該實例打破了傳統直通模式的侷限,能夠提供比單顆物理GPU更細粒度的服務,從而讓客戶以更低成本、更高彈性開展業務。安全

在該實例發佈以前,業內均採用以單顆物理GPU爲單位的雲端異構計算服務,這有利於客戶得到強有力的計算能力。如阿里雲在2017年10月推出了業界最全的異構計算家族,以及基於一個異構平臺的高性能計算平臺E-HPC,爲用戶提供單顆起步至超大規模的彈性計算服務。當用戶業務遇到業務高峯時能夠在數分鐘內實現擴容,大幅下降了企業使用異構計算能力的門檻,目前已服務於新浪微博、曠視科技、中國工程院等衆多企業和機構。架構

然而,在很多使用異構計算服務的場景中,「計算資源過剩」問題也尤其明顯。以雲遊戲爲例,企業一般僅須要一顆物理GPU幾分之一的計算能力便可流暢完成圖形或視覺計算;人工智能領域也存在相似問題,深度學習推理場景對GPU的計算資源消耗可能僅僅是訓練階段的數十分之一,甚至更少。對於這類應用場景而言,輕量級計算異構產品能夠提高系統靈活性,並大幅下降成本。框架

而阿里雲本次首家提供雲上輕量級GPU實例,意味着用戶能夠用更細粒度的計算資源開啓業務。該產品基於NVIDIA Tesla P4 GPU,支持多種規格,企業能夠按需選擇實例規格或者在雲市場選擇NVIDIA Quadro虛擬工做站,適用於雲遊戲、AR/VR以及圖形處理等隨需應變的GPU計算場景。運維

阿里雲表示,5月還將發佈基於NVIDIA T4的GPU異構計算產品VGN6i實例,NVIDIA T4採用最新的Turing架構,在虛擬化環境中更爲靈活,可加速深度學習和推理工做流程的Tensor Core,以及可加速光線追蹤和批量渲染的RT Core。機器學習

該產品由阿里雲與NVIDIA合做研發,集成了阿里雲智能資源調度技術,用戶能夠按需選擇適量的計算資源;同時,還採用了安全隔離技術,實現不一樣用戶之間的強隔離,有效防止信息泄漏;除此以外,QoS控制技術保障了每一個用戶的GPU資源不被其餘租戶搶佔。性能

阿里雲智能異構計算產品專家張新濤表示,「隨着輕量級GPU異構計算產品的推出,阿里雲實現了GPU的異構計算場景全覆蓋,能夠爲用戶提供從從輕量到高性能計算的服務。」學習

雲端異構計算並不是單純地堆積硬件性能,須要作深度的軟硬件結合及優化才能發揮其性能優點。阿里巴巴集團在異構計算領域擁有多年研發經驗,該技術大規模應用於拍立淘、商品分類等場景。優化

做爲全球前3、國內第一的雲服務商,阿里雲擁有豐富的異構計算產品,具有智能調度、自動運維、實時擴容等能力,結合業界首個自研的異構計算加速框架Ali-Perseus,能夠同時支持TensorFlow、Caffe、MxNet、Pytorch等流行機器學習框架在集羣訓練和推理時的加速,最高能夠將深度學習任務成本下降50%以上。
2018年12月,在斯坦福大學發佈的最新DAWNBench深度學習推理榜單,阿里雲異構計算得到了圖像識別性能及成本雙料冠軍。阿里雲

直播觀看地址:https://yq.aliyun.com/live/938
查看產品VGN5i:https://www.aliyun.com/product/ecs/gpu
VGN5i·釋放GPU計算新動力:https://promotion.aliyun.com/ntms/act/vgpu.html
阿里雲新品發佈會頻道:https://promotion.aliyun.com/ntms/act/cloud/product.html
阿里雲新品發佈·週刊:https://yq.aliyun.com/publication/36

 



本文做者:雲攻略小攻

原文連接

本文爲雲棲社區原創內容,未經容許不得轉載。

相關文章
相關標籤/搜索