阿里研究員吳翰清:世界須要什麼樣的智能系統?

阿里妹導讀:吳翰清,被你們親切地稱爲「小黑」「道哥」。他是阿里巴巴研究員,更是一位「白帽黑客」。15歲,考入西安交大少年班,畢業後應聘阿里。23歲,成爲阿里最年輕的高級技術專家。32歲,被評選爲2017年度全球35位35歲如下的青年科技創新人才(TR35)。網上有許多關於他的猜想,然而,他始終保持低調,專一於本身熱愛的事業。2014年以後,他幾乎再也不寫文章;但在今天,他有話想說,關於本身,關於科技,關於將來,說給你聽,說給世界聽。程序員

不得不說的話

在過去的18個月裏,我拒絕了全部的採訪,投入了所有的精力專心在作一件事情。因此我想先借着這篇文章澄清一下18個月以來網上的全部關於個人新聞、抖音視頻等,都是好事者編撰的個人段子,用來吸收流量的假新聞。這些假新聞讓我很苦惱,由於這些新聞將我描繪成爲了我最不想成爲的人,裏面的我是一個符號,而不是真實的我。我爲此專門給今日頭條寫過信,要求審覈並過濾這類不實傳播,但只清淨了一個月。我想再進一步只有向監管部門反饋,以及繼續保留法律追責的權利。數據庫

這些未經我許可的新聞和視頻,將我描繪成了一個無所不能的人,連帶着馬老師也受到了牽連。我想有沒有我,馬老師都睡得很安穩。阿里的安全是上千名工程師共同努力的結果,我一我的的力量在其中的貢獻極其微薄。我也從沒有黑過阿里的網站,只是之前由於工做性質在受權的狀況下對阿里的業務系統作過不少的安全測試。咱們不該該捧吹以破壞爲目的的黑客,那是犯罪,是我最不想成爲的人。我過去的工做是對抗黑客攻擊,打擊網絡犯罪,所以以破壞系統的黑客來描述曾經的我,是對我最大的羞辱。真正的黑客精神是挑戰權威,追求開放、自由,而並不是入侵計算機系統。我想是時候終止這些不正確的傳播了。瀏覽器

至於我過去取得的一點不足爲人道的成就,我想99%的讀者都沒搞明白我爲何會在2017年被評爲 MIT TR35,你們只是在看個熱鬧,鼓鼓掌。但我不須要這樣的掌聲,我不須要你們爲我我的鼓掌,我但願你們是爲個人做品鼓掌。這也是爲何在2014年之後我幾乎再也不寫文章的緣由。我但願你們記住的是個人做品,我對社會的貢獻,而非我我的的成長軌跡。從這個角度來看,我對本身還很是不滿意,人們關注個人經歷多過個人做品,因此我還得加倍努力。安全

就我我的來講,從2017年下半年開始,我離開了網絡安全領域,進入到了今天你們所說的人工智能領域。我帶領團隊在浙江,在上海,在重慶建設了不少關鍵的基礎設施系統。尤爲是2018年在上海作的事情,傾注了個人全部心血,我歷來沒有如此認真地作過一件事情,結果也很好。只是這些事情並未曾對外宣傳,故不爲外人所知。這18個月來關於我我的的假新聞滿天飛,讓我啼笑皆非,由於這些段子手連我最引覺得豪的事情都沒搞清楚。服務器

因此我今天決定寫一篇文章,做爲一名工程師,我想把我對將來的判斷寫下來,也許能夠幫助一些人少走一點彎路。只表明我的的見解,不表明公司的觀點。網絡

科技的進步是爲了解放生產力

我將生產力的進步分爲五個階段:體力勞動,機械化,電氣化,信息化,智能化。其中每一次科技的進步,都會帶來生產力的解放,對社會的改變是巨大的。工具

在140年前發生的第二次科技革命,讓電力深刻到各行各業。自從中央發電站和交流電變壓器等關鍵技術構建的電力基礎設施成型後,獲取電力的成本逐漸下降,各類各樣的電氣應用開始涌現,人們獲取到了新的、穩定的能源。性能

咱們如今知道電力最先是應用在電話、電報、電燈上的,也正是電氣照明這一需求,拉動了電力基礎設施的發展。由於在當時電力的用途比較單調,並無今天這麼琳琅滿目的電器。在100年前愛迪生通用電氣與威斯汀豪斯之間的主要競爭就是聚焦在電氣照明領域。咱們很難說在這個過程當中,究竟是電燈泡更重要,仍是發電站更重要。我曾經比喻說當前雲計算面臨的窘境,就是「中央發電站」已經造出來了,咱們有單集羣上萬臺服務器規模的算力基礎設施,可是「電燈泡」在哪裏卻沒有找到。咱們用「中央發電站」在點「煤氣燈」,今天託管在雲計算上的業務,大多數依然是「信息化系統」。而理想中的會消耗大量算力的應用,應當是「智能化系統」。咱們一直在苦苦追尋雲計算的「電燈泡應用」,卻夢寐以求。學習

這裏須要講清楚「信息化系統」和「智能化系統」的區別。我認爲「信息化系統」的本質是編輯數據庫,一個業務系統若是存在大量人工交互,依賴於人提交表單來完成業務,那麼就是一個信息化系統。而我理想中的「智能化系統」,應該是以自動完成任務爲目的,以任務做爲輸入,以完成的結果做爲輸出,中間的過程應該是機器高度自動化完成的。以其完成任務的複雜度,來評價其智能程度的高低。測試

從這個角度看,「智能手機」並不智能,依然是個「信息化系統」。市面上形形色色的智能系統也都只是冠上了智能的名號在魚目混珠。我並非說「信息化系統」沒有價值,信息化系統頗有價值,但不是下個時代的東西。自從計算機技術發展以來,產生的各色各樣的信息化系統極大地改變了世界,完成了從「電氣化」到「信息化」轉型升級的重要一步。這就是咱們看到各色各樣的計算機系統開始應用在各個領域,幫助人們更加高效的管理工做和提供服務。

互聯網在這一過程當中扮演了放大做用。我認爲互聯網自己並非生產力,互聯網只是鏈接了成千上萬個信息化系統,從而具有了規模效應。互聯網是規模經濟,能讓一個系統的價值實現上千倍、上萬倍的放大,可是生產力是信息化系統自己提供的。可以接收互聯網鏈接服務的終端,是瀏覽器,是 iOS 和 Android,這些端的演進自己是重要的。百度經過互聯網鏈接了人和信息,騰訊經過互聯網鏈接人和人,阿里經過互聯網鏈接了人和信息化服務。可是這些都不是下一個時代的東西。

下一個時代會發生的事情,首先是出現智能化系統對信息化系統的升級換代,而後會出現經過互聯網鏈接全部智能化系統的公司。智能化對信息化的升級換代,是一次巨大的生產力進步,處於社會變革中的商業公司的結局是適者生存。從歷史來看,在信息化時代的PC操做系統升級換代到移動操做系統,其過程就是天翻地覆的。蘋果的iPhone 發佈以後,全部的開發者都再也不給微軟的 Windows 寫軟件,而轉去給 iOS 寫軟件,對微軟帶來了強烈的衝擊,若是不是微軟後來又抓住了雲計算的機遇,就極可能會今後一蹶不振。從商業發展的角度看相似事件必定會發生,在信息化時代的龐然大物極可能隨着一次生產力的變革就變得無足輕重。那麼如今全部的問題在於,將來世界須要的智能系統究竟是什麼?

讓機器得到智能,一直是計算機科學家孜孜以求的事情。在過去簡單的專家系統,依靠經驗和規則,也能處理簡單的任務。但有一個弊病是對於專家經驗未覆蓋的異常狀況,機器就不知道怎麼處理了。因此後來出現了數據驅動誕生的智能。

咱們看到當機器具有必定的智能後,就能處理相對簡單的任務,從而部分地解放人的生產力,此時增長機器規模就等同於增長人力的規模。而機器智能和人的智能又各有所長,機器運算量大且不知疲倦,所以對於不少工做都有可能作到精細化管理。這每每能帶來成本的節約。

好比在過去公交車的排班是按照經驗,在一個線路里設置好公交車的數量,可是若是市民的出行狀況發生波動時,公交車的供需關係之間必定會存在差別,有的線路會繁忙,有的線路則會空閒,從而出現資源的浪費。要解決這一問題須要先統計清楚每輛公交車每一趟的精確載客人數,再依靠機器智能精細化的調度公交車到不一樣的線路,就能在同等資源下實現效率最優。所以使用機器智能的好處是顯而易見的。

五年前作不出大規模的機器智能系統

咱們看到在生產力發展的過程當中,從信息化到智能化的這一轉型升級正在到來,已經到了爆發的前夜。這得益於四項技術的成熟:雲計算、大數據、IoT、網絡鏈接技術。

咱們知道機器智能當前的發展是得益於對腦科學的研究,以及算力的進步,讓神經網絡進化到了深度學習,從而在視覺、語音等領域有了重大突破。算力的重要性毋庸置疑,可是光有算力依然難以在實際的應用中取得成功,還須要其餘幾項技術的成熟。在當前的技術環境來講,雲計算爲智能提供了足夠的算力,是算力基礎設施;大數據技術提供了數據處理的方法論和工具,是數據基礎設施(當前尚未壟斷性的數據基礎設施,碎片化嚴重);IoT 技術將智能設備的成本降到了足夠低,爲部署豐富的神經元感知設備提供了基礎;網絡鏈接技術,從4G到5G,爲數據的高速傳輸提供了重要基礎。

若是有科技樹這種說法的話,那麼機器智能的大規模應用,就須要先點亮前四個技術,這是基礎。在五年之前,這幾項技術的成本是制約咱們將智能技術大規模應用的主要瓶頸。到今天已經逐漸成熟了。

在一項新技術剛出現的時候,咱們每每會遇到兩個問題。

第一個問題是人才的稀缺性問題。咱們知道一個懂深度學習或其餘機器智能技術的博士生剛畢業的年薪可能比得上一個工做了十年的程序員。業界各處都須要機器智能,供不該求。

第二個問題是技術的成本問題。新技術剛出來的成本必定是昂貴的,就像雲計算剛出來的時候也是先解決能力問題,再解決效率問題。我前些時看一個報告,AWS 的 EC2 推出到如今連續降價了57次。咱們熟知的摩爾定律,計算的性能每18個月翻一倍,也就意味着同等算力的硬件每18個月會降一半的成本。機器智能做爲新技術也有一樣的規律,在一開始咱們不要期望它的成本會足夠便宜到能進入千家萬戶,新技術的普及須要時間。只是咱們每每火燒眉毛。

這兩個問題決定了機器智能在一開始的時候,應該首先被應用在對社會效率撬動最大的那個點上。從商業上咱們要找到這樣的場景,來讓這項技術脫離實驗室,走向社會,經過商業來源源不斷的滋養這項技術的迅速成長。

世界須要什麼樣的機器智能系統

這兩個問題隨着時間的推移很快就能解決。但今天產業界真正碰到的問題我認爲是搞偏了方向。這體如今兩個方面。

第一個問題是將來不該該存在一個「人工智能」的產業,咱們今天的分類就分錯了。就像自電力基礎設施誕生以來,各行各業都須要用電,所以電力成爲了一個關鍵生產要素。我認爲將來智能也是一個關鍵生產要素,每一個行業都須要,所以不須要單獨劃分一我的工智能產業。單獨搞了一我的工智能產業,反倒不知道這些公司在幹什麼了,這些公司本身也產生了困惑。最終應該像今天的零售業同樣,每一個作零售的都有個電商部門,會經過互聯網來作營銷和銷售。將來每一個企業也應該有一個部門,就是負責他們的智能系統的建設與訓練。要像訓練寵物同樣訓練智能系統,使他具有智能。這不是某一家人工智能公司要作的事情,而是每家公司都要本身作的事情。

第二個問題和機器智能技術的發展有關。由於最近此次機器智能的熱點是從深度學習開始,在視覺、語音等領域有了巨大突破,所以產業化後的企業每每都是在作視覺、語音、天然語言處理等工做。可是咱們千萬別忘了完整的人腦智能是從「感知」到「行動」,並經過不斷的反饋完成高頻率的協同,最終誕生了智能。

只作「感知」是一個巨大的誤區,從技術上講沒有問題,可是從商業上講創造的社會價值就頗有限了,由於其解放的生產力相對是有限的。

從生產力發展的角度來說,評判一個智能系統的社會價值,應該以它解放生產力的多少來衡量。只作「感知」就是隻能看,可是作了這麼多大型項目後,我發現全部的價值創造都是在於「處置」環節。所以只作感知,很難講清楚投入產出是否值得,可是一旦開始進入到「行動」環節,就會開始解放生產力,價值是可被量化的。這裏的行動,是機器智能實現了對人力或其餘設備的調度。

實際上從技術發展的角度看,咱們早就擁有了讓機器智能作決策的能力。搜索引擎和個性化推薦,就是典型的經過機器智能作決策。經過天天處理海量的數據,最終實現精細化的匹配。

因此我認爲一個完整的「智能系統」,是包含了「感知」與「行動」,其中支撐行動的是決策和調度的技術。而衡量這個智能系統是否有價值的標準,是看其解放的生產力的多少。

遺憾的是,到今天爲止我認爲業界並不存在一個理想的「智能系統」。業界當前的狀態我稱之爲「有智能,沒系統」。不少人工智能的創業公司擁有局部的智能能力,好比視覺、語音、NLP、知識圖譜、搜索、推薦等中的一項或多項技術,可是不多有公司有完整的技術棧。而像 BAT 等公司具有完整的技術棧,可是卻並無將全部的技術整合成爲「感知」+「行動」的一個完整系統,而是各項技術以碎片化的形式存在。尤爲是將全部技術應用到某一個具體場景中解決某一個具體問題的,更是寥寥無幾,而這正是催生出這一智能系統的關鍵所在。因此這是一個工程化的問題,工程化的挑戰在於整合全部智能技術,實現完整的「感知」+「行動」能力,並有效的控制成本,實現對開發者友好的接口。

在智能技術的角度來看,「自動駕駛」和「智能音箱」是兩個完整的從「感知」到「行動」閉環的場景。我認爲這兩個場景能夠用來打磨機器智能技術,可是當前在商業上比較難成功。「自動駕駛」解放了全部的駕駛員,對解放生產力的價值很是明顯,可是由於受制於今天城市的道路基礎設施,所以對老城市的意義不大。今天城市的道路不是爲自動駕駛設計的,也很難容納下自動駕駛的汽車。所以自動駕駛更適合航空、航海、物流等領域,商業範圍一下小了不少。「智能音箱」綜合了多項機器智能技術,其核心技術「對話機器人」被稱爲人工智能領域的聖盃,想要作好難度至關之大。可是「智能音箱」當前的階段對家庭中各類任務的生產力解放極其有限,價值很難講清楚,最後淪爲玩物的可能性比較大。儘管如此,隨着時間的推移,隨着基礎設施的更新換代,這兩項技術也會逐漸煥發出他們的生命力。

若是用航空業來比喻的話,今天的智能技術,就比如造飛機,市面上已經有了不少零件和引擎,可是全部的廠商都拿着零件當飛機賣,客戶覺得他買了一架飛機,其實只是買了個零件(由於生產力並無獲得多大的解放)。而今天真正的難點在於飛機設計圖紙都尚未。

因此我打算先畫一張,造架飛機玩玩。

構建智能時代

飛機想要真正飛上天,還須要幾個東西。

首先是飛行員。飛行員不必定要懂得怎麼造飛機,造飛機是個門檻很高的活。可是飛行員要懂得怎麼開飛機,最後還要讓人人都能坐飛機。我認爲飛行員就是將來各個企業裏智能部門的員工,他們負責訓練買來的智能系統,讓智能系統真正具有智能。因爲各個企業擁有的數據的不一樣,以及「飛行員」技能的高低和責任心,最後的各個企業的智能系統的聰明程度也會出現差別。世界是豐富多彩的。

其次是航道。我認爲航道依然是基礎設施提供商的,包括運營商、雲計算廠商等。

最後是機場。機場須要負責全部航班的調度和協同,爲全部的飛機提供服務。這是最有意思的地方。我認爲「機場」是最後真正的商業模式,就像蘋果的 AppStore同樣。

我認爲在智能時代的「機場」,最重要的工做是給機器智能系統提供服務,而並不是給人提供服務。

想象一下將來互聯網裏,70%-80%的人口是機器智能,他們處理了將來世界的絕大多數工做,而每個機器智能又是有一個主人的。其主人能夠是我的,也能夠是組織,但都是有主權的。每個機器智能存在的目標都是爲了完成某個或多個任務。那麼爲全部的機器智能提供服務,就會是一個巨大的商業模式。

機器智能系統的自動協同是通往將來的關鍵路徑

同時我也認爲當前的機器智能產業,過於重視人與機器的交互,而忽視了機器與機器的交互。然後者纔是更重要的事情。由於人與機器的交互依然是回到了信息化系統的老路上去,而機器與機器的自動協同,則是在進一步將智能系統的價值實現規模放大。

所以將來有必要給全部的機器智能定義一套語言,他們之間的交流能夠像人同樣擁有本身的語言,實現簡單的邏輯。而全部機器智能之間的交互與協同,是不須要人工干預的,就像你家的孩子與鄰居家的孩子本身會去玩耍同樣,你不須要干預到他們的交流之中,他們本身會各取所需地完成各自的任務。

以「一網通辦」的業務舉例。在當前一網通辦的主流實現辦法是將政府各委辦局的數據實現全量匯聚後,進行數據治理,並梳理流程,重塑業務。這種大數據應用的思路依然是停留在信息化建設的老路上,其弊端是想推進新技術落地的前提是流程先改革,同時各個不一樣地區的高度定製化致使很難在全國實現規模化的產品。但其實也能夠有另一種智能化的建設思路,讓每一個委辦局本身建一個機器智能系統,其任務就是代替公務員處理各自的窗口業務。當市民來提交一個申請時,通過認證後,該委辦局的機器智能系統就根據所需材料,自行向其餘委辦局的機器智能系統發出協同請求,通過幾輪機器智能之間的交流和協同以後,市民很快就獲得了他想要的結果。這種多個機器智能系統之間自動協同的機制,對流程的衝擊明顯會小不少。

機器智能之間的交互與協同須要經過網絡鏈接到一塊兒,但安全性是可控的,由於是業務之間的協同,而並不是數據自己發生了交換。由於每個機器智能都有本身的主人,全部的訓練過程也都發生在其主體內部,所以數據並不須要被拿出來交換共享。主人能夠設定機器智能什麼能說,什麼不能說,全部的安全控制都發生在智能系統內部,而一旦鏈接到互聯網要與其餘機器智能協同或使用「機場」提供的服務,就會轉爲「默認不信任」模式。

至於機器智能系統到底部署在公共雲仍是專有云,這並非一個重要的問題,主人愛部署在哪裏就部署在哪裏。因此時至今日,雲計算依然有被管道化的危險,就像運營商被互聯網內容提供商管道化同樣,將來雲計算廠商也可能會被智能廠商管道化。由於雲計算和大數據都不是智能。

A組

也所以,爲了以上這些構想,我受命在阿里雲成立「A組」。「A組」成立的使命就是爲了構建出這一機器智能系統,讓智能時代更快的到來。

我認爲這是一件須要整個社會共同努力三十到五十年的事情,就像在過去的三十到五十年咱們在信息化建設上付出的全部努力同樣。

以上,就是我想對世界說的話。

我說,你聽。


原文連接 本文爲雲棲社區原創內容,未經容許不得轉載。

相關文章
相關標籤/搜索