深度學習已至「瓶頸」?英特爾:數據處理是一劑良藥

 

 

文章發佈於公號【數智物語】 (ID:decision_engine),關注公號不錯過每一篇乾貨。git

 

 

 

來源 | 新智元github

編輯 | 木青、金磊算法

 

霍金弟子Alan Yuille在前不久發表言論稱,至少在計算機視覺領域,深度學習的瓶頸已至。然而,人工智能與大數據的發展是相輔相成的,數據將會推進人工智能的發展,促進更多技術應用落地,將人工智能帶入一個新臺階——數據紅利悄然將至。編程

 

深度學習已至「瓶頸」?數據處理或許是一劑良藥。瀏覽器

 

前不久,霍金弟子、約翰霍普金斯大學教授 Alan Yuille 發表言論稱,至少在計算機視覺領域,深度學習的瓶頸已至。安全

 

在此問題上,Alan Yuille 認爲該領域最嚴峻的挑戰是開發可以應對組合爆炸的算法,若是研究人員追求更多樣性的方法和技術,而不只是追逐當前的流行趨勢,這一領域將會獲得更快的發展。網絡

 

而如今,對於深度學習發展已經到了天花板的問題,彷佛有了另外的解決方案——數據。架構

 

英特爾公司架構圖形與軟件集團副總裁和數據分析技術總監馬子雅框架

 

6月18-21日,以「打破理論與現實的壁壘」爲主題的 O’Reilly 和英特爾人工智能大會在京舉行。機器學習

 

大會期間,英特爾公司架構圖形與軟件集團副總裁和數據分析技術總監馬子雅在被問到如何看待「深度學習到達瓶頸」的問題時表示,人工智能、數據分析界在此問題上長期以來有兩派意見:

 

  • 一派意見認爲人工智能的發展必定要經過對其算法的不斷提高才能真正把 AI 推到一個新臺階;

  • 另外一派意見認爲人工智能只作算法是不行的,如果不能更好地利用、分析數據,人工智能很快就會達到它的瓶頸。

 

而馬子雅認爲,兩者是相輔相成的,如同事物發展規律迂迴曲折,其最終結果會呈上升趨勢。

 

人工智能一直有所精進,但其應用方面並非很是理想。自從有了大數據,對圖像分析領域產生了突破性推動做用。

 

數據會推進人工智能的發展,會將人工智能帶入一個新臺階,部署行業應用,推動人工智能落地:

 

「人工智能業務的需求緊緊地根植於數據,要充分利用以數據爲中心的基礎架構,充分利用將數據分析與人工智能無縫銜接起來的軟件創新技術。」

 

而圍繞數據爲核心,英特爾在 AI 時代的戰略圖景也可經過這次大會有所瞭解:

 

  • 在軟件方面,提供一系列通用工具集,幫助用戶最大化利用硬件, 以及經過 BigDL 和 Analytics Zoo 構建統一的大數據分析與人工智能平臺,幫助用戶開發部署行業應用,推動人工智能落地;

     

  • 在硬件方面,提供完整的硬件產品組合和計算平臺,知足用戶從設備到邊緣再到雲端的不一樣工做負載需求 。

     

  • 在產、學、研生態打造方面,英特爾宣佈在中國成立大數據分析和人工智能創新院,進一步加快集成數據分析和AI的大規模創新與部署。

 

英特爾人工智能戰略的核心在於,致力於給客戶帶來領先的人工智能硬件和軟件產品組合,幫助用戶搭建所須要的AI應用,幫助客戶解決所面臨的個性化問題。除了技術自己,英特爾還致力於與普遍的行業夥伴合做,一塊兒面向共同服務的客戶,開發全套、全面、完整的AI解決方案。

 

在AI時代,英特爾正在完成一次轉型——從「芯片航母」到以數據爲中心,深挖數據紅利,釋放數據價值,經過軟硬件協同加速人工智能的行業應用。

 

01低門檻開源工具BigDL、Analytics Zoo,數據紅利悄然將至

 

人類處於一個數據變革的時代——歷史上 90% 的數據都是在過去幾年產生的,而 50% 的數據倒是在短短兩年所生成。

 

在過去的一段時間數據分析和人工智能獲得了空前的發展。

 

但事實上到目前爲止,只有 2% 的數據被真正的分析用來幫助人類的生產生活。人工智能是時候走出實驗室了,走向落地應用了。

 

而這一過程須要一條完整的數據分析流水線:

 

  • 第一步,一般須要從生產線上收集大量的原始數據;

  • 第二步,要對這些原始數據進行大量的清理和預處理;

  • 第三步,利用數據分析、機器學習、深度學習對於清理過的數據進行概括總結;

  • 第四步,可視化。

 

這條流水線有着較高的門檻:20% 的任務是深度學習,但 80% 都是在作數據收集、數據存儲、數據管理、數據清理、數據預處理。

 

這也正是英特爾開源 BigDL、Analytics Zoo 的重要緣由——下降門檻,讓人工智能走出實驗室。

 

目前,BigDL 和 Analytics Zoo 都已開源,大大下降了普通大數據用戶和數據科學家在使用深度學習進行數據分析和構建人工智能應用時的門檻。

 

 

GitHub開源地址:

https://github.com/intel-analytics/BigDL

 

先來看看 BigDL,BigDL 是一個創建在大數據平臺(Hadoop/Spark)之上原生的分佈式深度學習庫,它提供了在 Apache Spark 上豐富的深度學習功能,以幫助 Hadoop/Spark 成爲一個統一的數據分析平臺,爲整個數據分析和機器學習過程提供比現有框架更加統一和集成化的支持。

 

 

GitHub開源地址:

https://github.com/intel-analytics/analytics-zoo

 

同時,在 Apache Spark、BigDL 以及 TensorFLow、Keras 的基礎上又構建了一個大數據分析+ AI 的平臺 Analytics Zoo,方便用戶開發基於大數據、端到端的深度學習應用。

 

不止下降了開發者學習深度學習的門檻,在創建 AI 生態上,「釋放數據紅利」已經逐漸變成現實。

 

人工智能若是不能真正地效力於生產實踐,實際上是沒有任何價值的。看將來的趨勢,必須先看到人工智能對於將來哪幾個方面能產生比較大的影響。

 

英特爾經過 Analytics Zoo 構建統一的大數據分析和人工智能平臺,幫助用戶開發部署深度學習、人工智能和大數據分析的應用,攜手衆多合做夥伴和用戶,共同推進人工智能部署,加速落地。

 

美的,韻達,歐洲核子研究組織(CERN)都在利用英特爾 Analytics Zoo 進行人工智能的落地。英特爾藉助 BigDL 和 Analytics Zoo 幾乎與各行各業的廠商展開了合做,實施部署了各類各樣的人工智能的解決方案。

 

這其中就包括智慧醫療、智慧銀行、智慧交通、智慧生產、智慧電信等等。英特爾也與大型雲服務提供商、原型設備製造商、軟件開發商進行合做,將技術整合產品當中,包括阿里巴巴、百度、騰訊、京東等等。

 

同時,英特爾還推進與產、學、研的深度合做,打造AI生態。

 

在大會上,英特爾宣佈啓動英特爾數據分析和人工智能研究院創新院。創新院的主要負責人是英特爾高級首席工程師、大數據技術全球 CTO 戴金權。

 

這個創新院的主要工做集中在如下幾點:

 

  • 第一,加速人工智能在中國市場的落地,尤爲是經過將它與數據分析進行整合來加速落地。

  • 第二,解決中國市場的最新需求,引領創新,創新用法、創新算法。第三,幫助中國市場更好地使用英特爾最新的軟件和硬件技術。

 

02AI芯片,毫不能輸的戰場:不侷限於CPU,須要研發多種硬件形式

 

現在 AI 芯片已經成爲一個「毫不能輸的戰場」。

 

在 O’Reilly 大會期間,有着「芯片航母」之稱的英特爾在接受媒體採訪時透露了在硬件方面的佈局圖景。

 

馬子雅表示:英特爾的硬件圖景不僅集中在計算,咱們但願英特爾的硬件可以比較全面,例如針對存儲方面,英特爾開發了「傲騰」技術,另外英特爾也已經作了好久的網絡架構技術。

 

而做爲整個產業的根基,AI 芯片現在成爲各大巨頭紛紛爭先想要佔領的高地。收購 Nervana Systems,成爲英特爾全面擁抱人工智能的一個重要節點。

 

英特爾全球副總裁兼人工智能產品事業部總經理 Naveen Rao 表示 AI 已經是英特爾「毫不能輸的戰場」。在 2019 年 1 月,英特爾推出了 Nervana 神經網絡推理處理器。本次馬子雅也透露對於 Nervana 的將來規劃公司已有路線圖,會在更合適的機會和你們分享。

 

馬子雅強調將來的計算力不能侷限於 CPU 一種,尤爲是在 AI 時代,須要經過研發多種多樣的硬件形式,保證計算力可以在固定每幾年翻一番的速度繼續下去,可能都不是集中在通用芯片上,有時候是專用和通用的結合。

 

事實上,儘管 CPU 再也不是「惟一」,但仍然是計算結構裏不可或缺的重要組成部分。就如同 Naveen Rao 此前說得同樣,只要是馮·諾依曼架構,「你必需要有一個 CPU」。

 

英特爾一大優點在於,市面上已經安裝而且投入使用的 CPU,而硬件基礎設施的更新則是逐步進行,「把舊的全扔掉而後換新的」並不現實。現在,全球有 3500 萬公司使用英特爾的 CPU,眼下最火熱的人工智能推理,也有近 90% 是在英特爾的芯片上完成。

 

英特爾在製程與封裝上仍處於領先位置。製程工藝不斷向更高的晶體管密度發展,爲芯片帶來更強的性能和更低的功耗。擁有領先的製程技術,是構建領先硬件產品的關鍵。

 

製程的領先仍然是英特爾繼續發揮產品優點的關鍵因素,在 10 納米領域英特爾繼續推進產品的發展。在 Foveros 的製程中,英特爾的 3D 封裝技術可實如今邏輯晶圓上堆疊邏輯處理單元,可以把邏輯芯片和邏輯芯片連在一塊兒,更好地發揮異構功效。

 

另外,在 CPU 的周圍,你能夠放上 GPU、DSP、ISP,以及 NNP,或者各類新的架構。

 

 

英特爾認爲,將來十年架構創新會是創新的主要驅動力,將繼續帶來指數級的擴展效應。除了常見的標量、矢量、矩陣和空間這四種計算架構外,英特爾在架構創新上還作了更多的工做,例如:

 

  • Loihi 神經擬態計算。它能夠用超低的功耗去完成一個 GPU 用很高功耗才能完成的任務,並能經過學習獲得一個新的網絡。

  • 量子計算。量子計算是在架構上的另一個全新的超大並行規模計算。英特爾在量子計算有兩個不一樣的探索模式,一個是和業界相似的經過超導方式作量子位和量子芯片;另一種是基於英特爾比較擅長的硅處理工藝,用自旋的方式,目前也有了(自旋)量子位芯片,而且爲了可以規模化的生產和測試,專門和產業界、學術界合做。

 

保持 CPU 王者的領先優點,同時開發適合 AI 時代的多種硬件形式, AI 化是英特發展硬件的將來方向。

 

03AI並不是「一策萬能」:軟硬件協同創新,實現超異構時代的技術願景

 

事實上,過去幾年間計算力正在以驚人的速率增加。計算力指數級上升的實現,正是基於硬件與軟件的結合。若是想實現指數級的增加,必需要硬件和軟件共同創新。

 

在講述硬件將來圖景時,馬子雅提到須要研發多種多樣的硬件形式。然而,AI 並不是「一策萬能」。

 

沒有一種方案能解決全部問題(one size doesn’t fit all),須要多樣化的產品組合知足不一樣人工智能應用的需求。

 

從某種程度上,在人工智能這一領域,英特爾更像是 AI 解決方案提供者,針對不一樣的案例提供不一樣的軟硬件組合:

 

  • 從軟件層面,英特爾主要集中在開源方面,例如開源 BigDL 和 Analytics Zoo。

  • 將來十年的計算創新由架構驅動。英特爾具有獨具一格的優點,能夠將標量(CPU)、矢量(GPU)、矩陣(AI)和空間(FPGA)等不一樣架構整合到系統級平臺和系統級封裝,同時也在進行架構創新的新探索,好比 Loihi 神經擬態計算芯片、量子計算。

 

而怎樣進行組合則是由客戶的工做負載來決定,決定合適的軟件和合適的硬件。

 

 

馬子雅透露到,最有效的辦法、爲客戶提供最好的解決方案,就是先知道他的工做負載是什麼,而後找到相應的軟件硬件結合來解決那個工做負載,這是最行之有效的。

 

英特爾強調在硬件上每獲得一個指數級的性能提高,若是加上軟件的話可能有兩個指數級的性能提高。對於此,英特爾從操做系統再到上層整合成一個完整的全棧軟件技術(Vertical Stack),而後在硬件架構中所有打通。

 

經過這種技術可以把各類性能,架構上全部軟件的性能整合起來而後提供給用戶,大大提升其在這些架構上獲得的性能和算力。值得一提的是,英特爾「One API」項目將爲開發者帶來一套能提供一個統一編程模型的工具。針對跨多種架構的工做負載,這個模型簡化了相關的開發工做。

 

對英特爾而言,就是要提供多樣化的標量、矢量、矩陣和空間架構組合,以先進製程技術進行設計,由顛覆性內存層次結構提供支持,經過先進封裝集成到系統中,使用光速互連進行超大規模部署,提供統一的軟件開發接口以及安全功能,從而實現超異構計算的技術願景。

 

AI 計算現在已經邁入超異構時代,硬件基礎只是AI超級生態中的一個環節,可是以數據爲中心的將來還須要更完整的系統思考,單一因素已經不足以知足多元化的將來計算需求,必須實現軟硬件協同創新。

 

 

數智物語徵稿啓事0613.png

 

星標我,天天多一點智慧

 

相關文章
相關標籤/搜索