【F3使用場景】F3經典使用場景

摘要: 歸納F3經典使用場景算法

1. 人工智能深度學習客戶,推理應用
最近兩年,人工智能在全球掀起了巨大的應用熱潮,除了互聯網巨頭,如Google,Facebook,Alibaba以外,涌現出衆多的Start up公司,也都逐漸成爲行業翹楚。
在人工智能技術方案選擇上,GPU無疑是現階段的首選,這其中的主要緣由,一方面,GPU完善的生態,高並行度的計算力,很好地幫助客戶完成了方案的實現和部署上線;另一方面,人工智能發展,仍處於早期階段,各個行業都在從算法層面嘗試尋找商業落地的可能性,是一個從「0」到「1」的過程。在能夠預見的將來幾年,隨着人工智能落地應用愈來愈多,大規模商業部署漸漸成爲可能,進而對於更低功耗,更低成本,更低處理延時,更多定製化等的需求,將會逐漸凸顯。但是F3在人工智能大規模商業部署(推理應用)中,具有獨特的性能優點和廣闊的潛在空間不可小視。數據庫

  • 低延遲

相比於F3(FPGA),GPU計算的處理優點,在於其衆多專用的並行計算單元以及超高的顯存帶寬,讓多路大規模數據搬移快速並行計算成爲典型的計算模式,但這一模式致使了每路數據的處理延遲增長,對於一些低延遲需求的在線業務場景,如語音識別等。在Batch值較小的狀況下,F3(FPGA)的處理延時,僅爲GPU的1/10。安全

  • 超高的定點計算力

對於深度神經網絡的計算,一個發展趨勢就是下降數據表示的精度,下降網絡對於計算力的需求,以提升計算吞吐量。從雙精度浮點到單精度浮點,再到定點處理。而定點運算倒是FPGA的傳統優點,相比於GPU,FPGA內部配備了衆多的定點處理單元,甚至整個FPGA芯片內部邏輯資源所有能夠配置成定點處理單元,進而具有了超高的頂點運算能力。
目前申請測試的客戶中,有很大一部分就是衝着F3的這些優點而來,指望在其業務上帶來創新和產品的性價比提高。網絡

2. 基因測序
基因測序是一種新型基因檢測技術,可以從血液或唾液中分析測定基因全序列,預測罹患多種疾病的可能性,基因測序技術能鎖定我的病變基因,提早預防和治療,目前基因測序廣爲人知的是針對唐氏綜合徵篩查的無創產前基因檢測。伴隨着基因測序技術的快速發展,基因數據的生成呈現指數級增加,而應用也愈來愈普遍,對分析能力提出更高要求。併發

傳統的計算系統經過採用多個高端CPU搭建HPC系統實現了縮短期的目的,但這樣也使得成本增長,行業應用規模以及基因企業發展規模受限。目前國內基因企業,面臨基因計算成本偏高,而業務需求旺盛,急需高性價比的算力資源解決行業困境。高併發

以人類全基因組(WGS)分析爲例,單個WGS,使用一臺16c/64GB的CPU實例,完成分析須要近100小時的時間,而F3在30分鐘之內便可完成。極大地縮減了計算時間和成本。

經過選用F3雲主機,基因企業在基因計算環節能夠大幅提高產能;而普通大衆,也能享受成本下降帶來的普惠。性能

3. IC設計原型驗證
在傳統的數字IC設計流程中,使用FPGA搭建芯片原型驗證平臺,測試功能是重要的一個環節,在這個過程當中,須要大量的FPGA邏輯單元。而對於傳統數字芯片設計公司來說,購買或者自研複雜的FPGA驗證單板/或平臺,耗時耗力,且不是公司主要業務方案,加之FPGA平臺升級換代速度超過芯片設計週期,對於更大邏輯量FGPA板卡的追求,不斷研製最新fpga板卡一直是大型數字芯片設計的痛點之一。
F3雲主機,選用單芯片邏輯單元達250萬個的VU9P,支持雙芯片600Gbps的互聯,以及多板塊間的100Gbps的互聯,最大實例支持16個VU9P芯片,很好地知足了數字芯片原型驗證階段,對於大邏輯量的需求。
而客戶選用F3雲主機,避免了維護複雜FPGA板卡的大量人力物力的投入,縮減了驗證平臺的維護成本。學習

4. 視頻處理(視頻編碼,視頻內容處理)
隨着視頻採集及傳輸技術的發展,視頻素材的分辨率和幀率在不斷提高。分辨率從2K到4K到8K;幀率從30到60到120;新的標準及技術,好比HDR,也不斷出現。
素材質量的增加,圖像碼流量也隨之增加。人們須要壓縮率更好的壓縮算法標準,纔可以適應新的圖像壓縮需求:
• 一樣的壓縮率獲得更好的畫質
• 一樣的畫質獲得更好的壓縮率
以H.265編碼爲例,目前客戶選擇的主流技術平臺爲CPU或者GPU。
對於H.265/HEVC編碼處理,FPGA方案有着最完善的功能和preset配置,支持最多的有利於提升畫質和下降bitrate的功能,適合各個場景下H265/HEVC的編解碼配置。同時具備靈活部署,易於升級的特色,很是容易就能夠在某一個平臺上升級IP特性,甚至根據需求,隨時更換成其餘協議的編解碼功能。
FPGA的可擴展性也是GPU不可比擬的,能很是容易的在同一塊FPGA上pipeline部署編解碼相關的上下游應用;同時,由於FPGA之間的高速互聯特性,也能夠方便地在不一樣FPGA、不一樣FPGA板卡間部署完整的相關應用方案。
成本方面,高畫質IP雖然通道數量基本與GPU持平,可是帶來的bitrate的大幅下降,能夠顯著下降帶寬成本、存儲成本,綜合成本是下降的; 
如下爲一個典型的H.265編碼測試場景,在編碼速度對應x265的「very slow」配置結果,FPGA編碼器可以達到1080p60(60幀/秒)的處理能力,遠大於x265的3幀/秒。測試

5.數據庫加速
在數據規模爆炸式增加的背景下,數據處理的速度,無疑是用戶所關心的。
以大型互聯網公司爲例,天天處理的數據量級都在 PB ,天天更新的網頁以億計,每 24 小時更新的日誌超過PB。這樣的數據規模,對於目前的處理平臺,是個巨大的挑戰,須要大型的集羣來完成。而在這樣的數據處理規模中,數據倉庫的性能,直接關係到了數據自己的處理能力。大數據

F3(FPGA)雲主機,得益於FPGA細顆粒度的數據處理能力,高併發度的並行計算能力,可以大幅提高數據庫產品的性能:

  • 以數據庫處理中的排序單元爲例,在PostgreSQL的核心處理單元加速中,F3相比CPU可以帶來10倍以上的性能提高。
  • 再以時序數據的處理爲例,大數據領域中,時序數據使用超過一半。普遍應用於物聯網(IoT)設備監控系統 ,企業能源管理系統(EMS),生產安全監控系統,電力檢測系統等行業場景。F3單路數據吞吐性能是單核CPU的30倍以上!

原文連接

相關文章
相關標籤/搜索