「21世紀的計算「大會算法
「二十一世紀的計算」學術研討會是微軟亞洲研究院自成立之初便開始舉辦的年度學術盛會。做爲中國及亞太地區規模最大、最具影響力的計算機科學教育與研究盛會之一,迄今爲止該大會已在中國、日本、韓國、新加坡等多個國家和地區成功舉辦了17屆,參會人數累計超過40,000人。編程
11月3日,以「Human and Machine Working as a Team」(人機協做)爲主題的第18屆「二十一世紀的計算」學術研討會於韓國首爾舉行,包括2002年圖靈獎得到者Adi Shamir、微軟全球資深副總裁Peter Lee、微軟全球資深副總裁,微軟亞太研發集團主席兼微軟亞洲研究院院長洪小文博士在內的衆多計算機領域頂級大師,分享了他們各自獨特且深遠的看法。服務器
如下是微軟全球資深副總裁Peter Lee的演講精選,由微軟亞洲研究院首席研究員劉鐵巖博士擔任現場點評。其餘演講亦將陸續發佈,敬請期待。網絡
演講者簡介機器學習
做爲微軟全球資深副總裁,Peter Lee博士負責微軟研究院新體驗與新技術部門(New Experiences and Technologies, 簡稱MSR NExT)。NExT聚集世界頂尖研究者、工程師和設計師,致力於爲微軟和世界創造顛覆性創新技術。NExT不只將持續推進計算機科學領域的前沿技術發展,對學術界產生深入影響,更將經過技術研發助力微軟公司長遠發展並惠及全世界。分佈式
做爲NExT的負責人,Peter Lee全面負責微軟亞洲研究院、微軟研究院新技術部(MSR Technologies)、FUSE實驗室、微軟研究院特別項目部(MSR Special Projects)以及多個孵化項目團隊。工具
點評人簡介學習
劉鐵巖博士,微軟亞洲研究院首席研究員,美國卡內基梅隆大學(CMU)客座教授、英國諾丁漢大學榮譽教授、中國科技大學、中山大學、南開大學博士生導師。劉博士的研究興趣包括:人工智能、機器學習、信息檢索、數據挖掘等。他的先鋒性工做促進了機器學習與信息檢索之間的融合,被國際學術界公認爲「排序學習」領域的表明人物,他在該領域的學術論文已被引用萬餘次,並受Springer出版社之邀撰寫了該領域的首部學術專著(併成爲Springer計算機領域華人做者的十大暢銷書之一)。大數據
近年來,劉博士在博弈機器學習、深度學習、分佈式機器學習等方面也很有建樹,他的研究工做屢次得到最佳論文獎、最高引用論文獎、研究突破獎,被普遍應用在微軟的產品和在線服務中,並經過DMTK、Graph Engine等項目開源。他曾受邀擔任了包括SIGIR、WWW、NIPS、KDD、AAAI、WINE等在內的十餘個頂級國際會議的組委會主席、程序委員會主席或領域主席;以及若干頂級國際期刊的副主編。他是美國計算機學會(ACM)傑出科學家、國際電子電氣工程師學會(IEEE)和中國計算機學會(CCF)的高級會員,中國計算機學會的傑出演講者和學術工委。優化
很高興有機會在這麼多聰明的學生面前發言,談談研究這件事,哪怕要說清楚到底什麼是研究其實並不容易。
愛因斯坦說過,「若是咱們知道本身在作什麼,這事就不會被稱爲研究,對不對?「
聰明如愛因斯坦也以爲解釋什麼是研究並不容易。
但我能夠試試在此次演講中,說說我爲何認爲研究是如此使人興奮,以及爲何說咱們正處在計算機科學研究的「黃金時代」。
今天的計算機研究天天都在發現新的東西,而這些東西每每是一些精彩的理論。但與此同時這些研究也很是實用,最終都將幫人們過上更好的生活。所以,一個有趣的現象是世界各地的大學和頂尖公司都在投入大量的人力物力從事計算機的基礎研究。
像蘋果、Facebook這樣的大型科技公司正在創建大型研究實驗室。甚至像Uber這樣的初創公司在逐步變大時,也會在研究上投入金錢,物力。而在不斷涌現的科技進步中,我認爲有三點特別重要,分別是超大規模的計算能力、無處不在的大數據、機器學習,尤爲是深度學習算法和理論的發展,即將催生一種人工智能能力。
結果是科技產業比以往更離不開研究。科技產業對研究的投入比以往任什麼時候候都大。這究竟是什麼狀況,爲何會出現這種狀況?這就是我今天演講的主題。
計算對咱們生活的影響正在迅速增加。它也發生得很天然,有時咱們甚至沒有注意到。
上面這張圖,這位女士正帶着一臺小型計算機Microsoft Band,上面有十幾臺傳感器。在她運動的過程當中,這些傳感器在測量她的心率、跟蹤她的路線等等……海量的數據由此產生。
而當這臺設備與她的手機等其餘設備進行同步,在雲端可能有更多設備在爲她服務,這就是雲計算。
雲計算的能力包括核心CPU、內存、存儲和網絡,一般位於大型數據中心,這些數據中心基本上是包含大量計算設備的大型建築,具備高度優化和精心管理的電源和冷卻功能。
微軟在世界各地擁有超過110個數據中心,咱們的客戶對咱們的數據中心的使用正以每一年一倍的速度增加。咱們每月都要向咱們的數據中心添加更多計算機。這是咱們一個數據中心的航拍照片:
涉及到數據中心這種大規模的工程背後還有許多棘手的科學問題有待解決,網絡、分佈式計算、容錯、資源分配和調度,以及一系列基本算法問題等。因此,實現超大規模的計算能力是微軟等頂尖公司的研究目標。
摩爾定律現在正在接近一些物理的限制,若要保持這一部分的增加,就必須爲數據中心找到新的增加方法來提升計算能力。
今天,在微軟的數據中心,咱們正在部署基於現場可編程門陣列FPGA的新處理元件,以期實現人工智能超級計算機的計算需求。
此外,咱們還在努力研究如何以環境可持續的方式驅動數據中心。
咱們作了一些有趣的早期試驗。
劉鐵巖博士:Peter提到,爲了推進計算機行業的持續高速發展,不只要從事軟件研究,也要反思硬件的侷限性,發明更新型的硬件體系結構。這幾年,微軟在硬件方面的投入不少,包括用FPGA武裝雲計算的數據中心。FPGA是一種很是靈活的低功耗硬件,能夠適應豐富的計算需求。咱們研究院最近作了不少關於如何利用FPGA來加速深度學習的工做,讓硬件的研究和人工智能研究無縫接軌。
數據中心的維護費用耗資巨大,如何下降服務器降溫過程當中的能耗問題十分關鍵。微軟研究院的Project Natick項目創新地把數據中心置入大海,利用寒冷的海水冷卻服務器,並用海浪爲之提供電能,還可能減小近海大城市數據傳輸的延遲。
除了雲計算以外,大數據和算法的進步也格外重要。特別是機器學習算法對人工智能的推進做用。
微軟水下數據中心
這張圖咱們顯示了機器學習的簡化流程圖。機器學習的一個應用方向是賦予機器理解人類語言的能力。咱們蒐集了大量音頻數據及對應的文本數據做爲訓練數據,輸入到機器學習算法中。該算法將「學習」訓練數據中的模式,並從中建立稱爲「模型「的新算法,最終將該算法投入語音做爲輸入的系統中實用,並輸出對應的語音翻譯。
目前,這一技術已經成功應用在了微軟實時語音翻譯Skype Translator上了,目前已支持8種語言的實時語音翻譯和50種語言的文本翻譯。
劉鐵巖博士:利用深度學習技術,微軟研究院最近在語音識別上有了新的突破,識別了已經超過了人類的水平。並且也在積極推進這項技術的產業化。
「神經語音識別 神經機器翻譯」是Skype
劉鐵巖博士:現場在放一個視頻,關於Skype Translator如何幫助有聽力障礙的孩子進行交流。當Skype Translator把世界兩端、從前幾乎沒法交流的人實時連接在一塊兒、進行幾乎無縫的交談時,確實有一種科幻小說的即視感。
Skype Translator來啦
英語裏有一個單詞Serendipity,意思是偶然發生的快樂事件。這對於研究來講是時常發生的。當你開始研究一些東西,最終頗有可能獲得一些意想不到的精彩,這意味着咱們須要對意想不到的事件保持開放心態。
劉鐵巖博士:Peter在展現使用微軟的WordFlow技術,如何在手機上僅用十幾秒鐘,輸入一段很是複雜的文字。
機器學習也正在爲計算機賦予「看」的能力。只須要訪問https://www.captionbot.ai/
微軟在計算機視覺方面有着很是領先的技術。你們應該都知道得到去年ImageNet比賽5項冠軍的ResNet吧?今年咱們研究院的小夥伴再接再礪,又取得了COCO比賽中物體分割的冠軍。
機器學習也給予計算機「看」的能力。
深度神經網絡的進步愈來愈大,加上愈來愈多的訓練數據和更好和更好的算法,讓機器有能力「理解」一張照片。
這意味着咱們愈來愈好。
你們能夠從這些圖像看到物體鎖定和識別的能力有多大。
若是你想試用咱們的計算機視覺DNN,只要拿起你的智能手機,去captionbot.ai,就能夠用您的相機,讓咱們的系統「看到」和「解釋」您正在看的是什麼……
對許多人來講,言語和視覺是很是有趣的,由於它們是人類能夠作的事情。但我認爲機器學習和AI會爲咱們作的不少事情將更加「隱形」。
舉例:這是一個演示視頻,咱們稱爲「全息傳輸」。你在這張圖片中看到的是咱們一位前研究者,叫Shahram Izadi。圍繞他的是幾個特殊的用於捕獲3D圖像的相機。來自這8個攝像機的3D信息是一大份數據,大約每秒2G規模,爲在互聯網上作到實時傳輸數據,咱們必須作大比例的數據壓縮。若是這能作到,就能夠創造驚人的體驗。
劉鐵巖博士:如今,Peter經過視頻向你們展現了HoloLens的「全息傳輸」技術,這也是機器學習能力的另外一個體現。視頻在此:
實時虛擬3D傳送 Skype Translator來啦
劉鐵巖博士:最後,Peter Lee博士向現場在座的大學生分享了一些想法,指導你們如何參與到人工智能的大潮中。最重要的是努力學習。微軟也爲你們提供了Microsoft
Microsoft Cognitive Toolkit (微軟認知工具包)連接:
https://www.microsoft.com/en-us/research/product/cognitive-toolkit/
最後,我想說說今天的研究對這世界是多麼重要。
人類歷史上有過一個類似的時代:大約在1450年,約翰內斯·古登堡印了一本聖經,後來稱爲古登堡聖經。當時,全歐洲大約有30000本書,外加一臺活字印刷機。
但隨着活字印刷機日益普及,50多年後,出現了超過1200萬冊書籍和1000多臺活字印刷機。
這其實是一箇中世紀的摩爾定律。
你會看到,活字印刷機就是最終普及圖書、從而普及知識的強大力量。
今天,咱們從不斷提高的計算能力看到了與印刷機一樣重要、具備顛覆意義並最終能讓人類變得更強大的力量。
做爲研究人員,咱們固然想用這些能力來作偉大的事情。
但做爲研究人員,咱們也要努力讓能量巨大的計算和算法得以普及。
咱們必須普及AI。
咱們必須共同努力,確保人類和機器能夠協同工做。
咱們必須讓地球上的每個人、每個組織變得更強大。
我表明微軟每一個人保證這就是咱們的目標。
謝謝你們。
劉鐵巖博士:總結一下,Peter在演講裏提到了推進人工智能研究和產業發展的三個重要因素:超大規模的計算能力、無處不在的大數據、機器學習尤爲是深度學習算法和理論的發展。能夠說,咱們這一代研究人員站在了一個可貴的歷史機遇面前,但願咱們可以借力於這些因素,把人工智能推向一個新的高度。
展望人工智能進一步的發展,其實還有很長的路要走。有不少高級的人工智能問題,包括語義理解、無監督學習,都不是簡單地使用更多計算資源、從更大的數據中學習更復雜的深度神經網絡,就能解決的。這些應用呼喚着新的創新破土而出。 咱們研究院最近有幾個工做,正是沿着這樣的研究思路開展。好比咱們剛剛發表在NIPS上的Dual Learning方法,就是利用AI任務之間的內在關係爲無監督數據創造有效的反饋閉環,從而實現有效的學習;另一篇一樣發表在NIPS上的LightRNN算法,就是要告訴你們有時精巧的算法設計可能會帶來比蠻力並行訓練更大的收益。咱們最近在整理一套輕量級的快速有效的機器學習算法,其中包括去年發表的LightLDA算法,今年發表的LightRNN和LightGBM等,這些算法都會陸續開源到微軟機器學習工具包DMTK裏,歡迎你們試用,也歡迎你們加入到四兩撥千斤的人工智能研發中來。