王玉偉,騰訊TEG架構平臺部平臺開發中心基礎研發組資深工程師,專一於爲數據中心提供高效的異構加速雲解決方案。目前,FPGA已在騰訊海量圖片處理以及檢測領域已規模上線。算法
隨着互聯網用戶的快速增加,數據體量的急劇膨脹,數據中心對計算的需求也在迅猛上漲。諸如深度學習在線預測、直播中的視頻轉碼、圖片壓縮解壓縮以及HTTPS加密等各種應用對計算的需求已遠遠超出了傳統CPU處理器的能力所及。摩爾定律失效的今天,關注「新「成員(GPU\FPGA\ASIC)爲數據中心帶來的體系架構變革,爲業務配上一臺動力十足的發動機。編程
明明CPU用的好好的,爲何咱們要考慮異構計算芯片呢?網絡
隨着互聯網用戶的快速增加,數據體量的急劇膨脹,數據中心對計算的需求也在迅猛上漲。諸如深度學習在線預測、直播中的視頻轉碼、圖片壓縮解壓縮以及HTTPS加密等各種應用對計算的需求已遠遠超出了傳統CPU處理器的能力所及。架構
歷史上,受益於半導體技術的持續演進,計算機體系結構的吞吐量和系統性能不斷提升,處理器的性能每18個月就能翻倍(衆所周知的「摩爾定律」),使得處理器的性能能夠知足應用軟件的需求。可是,近幾年半導體技術改進達到了物理極限,電路愈來愈複雜,每個設計的開發成本高達數百萬美圓,數十億美圓才能造成新產品投產能力。2016年3月24日,英特爾宣佈正式停用「Tick-Tock」處理器研發模式,將來研發週期將從兩年週期向三年期轉變。至此,摩爾定律對英特爾幾近失效。性能
一方面處理器性能再沒法按照摩爾定律進行增加,另外一方面數據增加對計算性能要求超過了按「摩爾定律」增加的速度。處理器自己沒法知足高性能計算(HPC:High Performance Compute)應用軟件的性能需求,致使需求和性能之間出現了缺口(參見圖1)。學習
一種解決方法是經過硬件加速,採用專用協處理器的異構計算方式來提高處理性能。優化
圖1 計算需求和計算能力的缺口發展形式雲計算
一般咱們在爲業務提供解決方案的時候,部署平臺會有四種選擇CPU、GPU、FPGA、ASIC。那有什麼標準來評判計算平臺的優劣呢?加密
圖:我是法官,標準我說了算spa
當今理想的協處理器應該是基於硬件的設計,具有三種基本能力。第一是設計可以提供專門的硬件加速實現各類應用中須要的關鍵處理功能。其次是協處理器設計在性能上很是靈活,使用流水線和並行結構,跟上算法更新以及性能的需求變化。最後,協處理器可以爲主處理器和系統存儲器提供寬帶、低延遲接口。
除了硬件要求之外,理想的協處理器還應該知足HPC市場的「4P」要求:性能(performance)、效能(productivity)、功耗(power)和價格(price)。
HPC市場對性能的最低要求是全面加速實現算法,而不只僅是某一步驟,並可以加速實現整個應用軟件。
效能需求來自最終用戶。在現有的計算機系統中,協處理器必須安裝起來很方便,提供簡單的方法來配置系統,加速實現現有的應用軟件。
HPC市場的功耗需求來自計算系統安裝和使用上的功耗限制。對於大部分用戶,可以提供給計算機的空間有限。計算系統的功耗越小,那麼能夠採起更少的散熱措施來保持計算機不會過熱。所以,低功耗協處理器不但可以爲計算系統提供更低的運轉成本,並且還提升了計算系統的空間利用率。
價格因素在HPC市場上顯得愈來愈重要。十幾年前,某些應用軟件對性能的需求超出了單個處理器能力範圍,這促令人們採用專用體系結構,例如密集並行處理(MPP)和對稱多處理(SMP)等。然而,這類系統要求使用定製處理器單元和專用數據通路,開發和編程都很是昂貴。
如今的HPC市場拋棄瞭如此昂貴的方法,而是採用性價比更高的集羣計算方法。集羣計算採用商用標準體系結構,例如Intel和AMD;採用工業標準互聯,例如萬兆以太網和InfiniBand;採用標準程序語言,例如運行在低成本Linux操做系統上的C語言等。當今的協處理器設計必須可以平滑集成到商用集羣計算環境中,其成本和在集羣中加入另外一個節點大體至關。
瞭解了基本的評判標準以後,咱們以當今最火的深度學習爲例,從芯片架構、計算性能、功耗、開發難度幾個方面來對幾種不一樣的芯片進行分析對比。
深度學習的學名又叫深層神經網絡(Deep Neural Networks),是從人工神經網絡(Artificial Neural Networks)模型發展而來。咱們以深度學習做爲切入點來分析各個芯片的性能。圖3是神經網絡的基本結構,模型中每一層的大量計算是上一層的輸出結果和其對應的權重值這兩個矩陣的乘法運算。
圖3 神經網絡基本結構
橫向對比CPU,GPU,FPGA,ASIC計算能力,實際對比的是:
1.硬件芯片的乘加計算能力。
2.爲何有這樣乘加計算能力?
3.是否能夠充分發揮硬件芯片的乘加計算能力?
帶着這三個問題,咱們進行硬件芯片的計算能力對比。
相關推薦
深刻理解CPU和異構計算芯片GPU/FPGA/ASIC (下篇)
此文已由做者受權騰訊雲技術社區發佈,轉載請註明文章出處,獲取更多雲計算技術乾貨,可請前往騰訊雲技術社區
歡迎你們關注騰訊雲技術社區-博客園官方主頁,咱們將持續在博客園爲你們推薦技術精品文章哦~傳播騰訊海量技術實踐經驗,www.qcloud.com