轉載自「大數據文摘」可快捷關注算法
昨日,極客公園創新大會在北京開幕,百度深度學習研究院(IDL)副院長餘凱發表演講,闡述大數據時代,人工智能與深度學習的發展。安全
如下是餘凱的演講實錄:網絡
各位朋友早上好!在個人演講以前,先給你們看一段有趣的視頻。你們看這輛車開進咱們會場,正從個人左側往右側開過來,上面沒有人,它自平衡行走,看起來有點詭異。爲何咱們會作這樣有趣的自行車?它是真正的自行車,之前的自行車不是本身行走的。爲何作這個事情,這個就涉及到我今天演講的話題,就是百度大腦所思考的人機關係。學習
你們可能會好奇,什麼是人工智能?這是一個很嚴肅的學術話題,今天這個會場我想咱們抱着對科技的熱情,不須要那麼嚴肅,你們跟我同樣是科技的粉絲,看過這樣的電影,這個小機器人,它具備至關高的智能。首先這個小機器人具備感知的能力,他有眼睛,能夠感知這個環境:哪一個地方是路,哪一個地方是障礙。測試
感知的基礎上它就會思考和理解,理解什麼呢?好比說這個地方是平地它能夠走,這個地方是下去的坡,它不能走,這就是理解。在理解的基礎上,它說會去控制,去決策。因此說你看,從感知、理解到決策,在一個小的機器人身上體現得淋漓盡致,這就是很是直觀地感受人工智能涉及的幾個方面。大數據
智能的本質是學習搜索引擎
在今天的市場上面,充斥着智能設備,有智能手機、智能手錶、智能水杯,前一段谷歌說作智能湯匙,咱們在作智能筷子。它們爲何叫智能產品?他們是否是真的有智能?咱們來思考一下。咱們把全部的產品放在一邊,另一邊是六七十年代的老式收音機。他們有什麼不一樣,都是在人操控的狀況下去完成一些任務,從這個角度講,他們看似並無太多的不一樣。人工智能
思考這個問題,實際上能夠幫助咱們區分如今的這些智能產品,哪些多是不必定智能的。舉個例子,若是在座的跟我是同一個年紀的話,在小學的時候學過一篇課文,講板凳的故事,愛因斯坦作了一個小板凳,作的很粗陋,根據這個情況咱們能不能說他不聰明。跟同年代的小朋友和作的小板凳比,你能夠得出結論這我的不是那麼聰明。愛因斯坦作這個板凳以前,每一天都在作好多板凳,每一次都在提高,根據他過去作的經驗和教訓去改進他的下一次。若是動態地看,你會發現他是一個不斷學習成長的曲線。spa
這裏面智能的本質在於什麼呢?在於你是否是隨着經驗不斷地演化,不斷地進步,正如咱們的主題叫覺醒叫進化,進化其實是智能的本質。這裏面的經驗是什麼呢?經驗就是數據。你隨着過去的經驗數據可以不斷地學習,不斷地提高,今天可能不聰明,可是明天你會變得更聰明,這是智能的本質。因此學習是智能的本質。翻譯
經驗數據與深度學習
這裏面提到一個很是重要的方面,就是經驗。在計算機科學和人工智能領域,咱們叫它經驗數據。經驗就是數據,數據就是經驗。這就涉及到咱們今天常常提到的所謂大數據,是由於咱們如今迎來一個偉大的時代,這個時代就是大數據的時代。咱們來看看,移動互聯網給咱們帶來怎麼樣的深入變化。
好比說這是2005年聖彼得教堂門口的廣場上,不少的信衆在等待教皇的選舉結果。八年之後新的一代教皇從新選舉,一樣是那批信衆,咱們看到移動互聯網怎麼改變世界,每一個人都鏈接了他的設備,這些設備無時無刻都在產生數據。今天在座的每一個人跟我同樣鏈接平均兩到三個設備,個人口袋裏面就有兩個手機。
可是這個數據到2020年,呈現不斷爆炸性增加的趨勢,甚至有比這個預測更加誇張的。前段時間烏鎮大會上孫正義說到,2020年每一個人要鏈接1000個設備。這個不必定那麼誇張,每一個鈕釦可能都是一個智能的鏈接設備。移動互聯網時代萬物互聯,隨之而來的就是數據的爆增。大量的數據給咱們帶來史無前例的機會,因此說咱們從萬物互聯到大數據時代,大數據時代隨之而來的就是無處不在的智能。
最近幾年,咱們在人工智能領域常常聽到最引人矚目的領域就是深度學習。跟大數據時代悄然地發生在一塊兒,這裏面有它深入的時代背景。咱們看一下這個曲線,咱們的橫軸是數據規模,傳統的人工智能的算法下,數據到了必定程度效果再也不提高。對於深度學習,咱們看是怎樣的曲線。隨着數據不斷增加,效果會不斷地提高。因此說深度學習能夠幫助咱們去吸取數據所帶來的紅利。從技術的角度是這樣看,若是從商業的角度來看,你會看到若是你的商業模式也是隨着數據的增加陳興國ian這樣的曲線,那說明什麼?我要恭喜你,你有一個很是好的壁壘,一個競爭壁壘。
爲何?由於收集數據須要時間,別人要得到一樣的能力,他須要花更長的時間,因此你永遠跑在前面,搜索引擎就是這樣的一個模式。基於大數據的商業模式是有很好的競爭壁壘。
百度深度學習的落地點
百度過去兩年在深度學習這個領域能夠說是作了不少工做。到今天,百度大腦這個項目已經取得了至關大的進展。它是一個無時不刻在學習、演進和進化的系統。兩個月前我給你們介紹的時候,我介紹的是百億級的參數構建世界上最大的深度神經網絡,今天我把百億級改爲千億級,能夠構建更大規模的深度神經網絡。
具體落地的有哪些呢?深度學習開始是受到大腦結構的啓發。今天咱們更可能是從統計和計算的角度來看待這個問題,另外也有不少的學者從仿真大腦的生物學角度去作這方面的研究,這兩條路應該是齊頭並進,互通有無,互相幫助的。
至於談到百度深度學習在內部落地在什麼地方,咱們能夠看到在搜索、廣告投放、圖像識別和語音識別這些領域,都有至關大的進展。好比說咱們看搜索,沒有用到深度學習時,綠色的是咱們在搜索滿意度上面領先競爭對手的比例,用了深度學習之後,過去一年咱們提高的比例是這樣子的。從另一個角度講,它也是目前深度學習技術用在天然語言方面最成功的一個例子。
固然,在廣告投放這個領域,整個百度鳳巢廣告系統已經進入深度學習的時代,廣告的點擊率提高很是顯著,具體的數字是商業祕密,我不能講,是百分比兩位數的提高,這個對公司的營收是有一個巨大貢獻。
在語音這一塊,能夠說咱們過去兩年裏面語音識別率不斷提高,移動搜索中文語音識別咱們是世界領先的。在圖像這個領域,去年咱們在物體檢測模型上單個模型是世界最好,谷歌是第二。
你們可能會關心,在過去幾年裏面,技術的發展在圖像分類這個領域是一個怎樣的量變到質變的過程,咱們仍是看圖像分類的例子。這邊我給你們演示的是在最近這幾年,世界上最好的成績是怎麼樣變化的。2010年世界最好的成績在那個地方,整個深度學習往前發展,咱們看到每一年它都是以很快的速度向前演進。在2014年年末的時候,這個結果是到5.9%這樣的錯誤率,這是百度作到的,也是世界上目前最高的圖像識別準確率,你們可能會很關心,它比起人類的能力是什麼水平。人類的水平在這個地方,差很少接近5%的錯誤率。
咱們剛纔講的圖像和語音,反映在咱們的產品就是百度翻譯APP,你能夠用中文語音說,立刻自動翻譯成英文。它還能夠拍照,外國人來上海,看到這樣的菜單,拍照之後圖像就能識別翻譯成英文,能夠理解這個菜是什麼菜。
用人工智能的技術能夠幫助小朋友有更快樂的童年,暑假能夠有更多的時間玩。這不是直接幫你作題,它是告訴你知識點在什麼地方。
關於人臉識別的技術發展,也跟你們彙報一下最新成果。在最通用的人臉識別的測試上面Facebook宣佈作到最好的成果是97.35%,百度同事取得了更激動人心的進展,最好的人臉識別準確率是99.62%。斯坦福大學科研人員最近用人作了一個測試,人在這個數據上面達到99.2%。
我必須給你們澄清,機器的算法作到接近人的水平,其實只是說數據級上面作到人類的水平,總體來說,如今機器智能的水平離人仍是有差距的,咱們還在努力中。
你們小時候有可能作過看圖說話,你看到圖片要用天然的語言描述這個圖片的故事是什麼。對於左邊的這幅圖,若是用一個天然語言描述說是一個黃色的bus,對另一幅圖像咱們用天然的語言的句子「下午的陽光照進房間」描述這樣一個場景。這些語言實際上不是人來寫的,是機器生成的。
不少人工智能的算法在不斷地積累它的勢能,改變人們生活的方方面面,好比說機器人領域,具體的例子就是高度自動化的駕駛,這是百度深度學習研究院的團隊同窗們在改裝的各類車,這邊是咱們的一個車上面的感知器演示,集成了雷達、紅外、攝像頭,每個感知器覆蓋了不一樣方面,有各自的優點和劣勢,怎麼樣集成在一塊兒對道路的狀況有一個理解,自動地去行駛。
咱們基於這些傳感器對道路有三維的理解,這個理解作的比人更精確。好比說今天的導航系統只知道你在哪條路上,不知道在哪一個車道上,咱們利用更先進的感知系統可使車定位在車道上面,精度是10-20釐米的距離。咱們能夠預見後面1-2年時間裏面,導航系統會發生翻天覆地的變化,在北京的街頭你要上立交橋的時候,有的時候前面有三五個分岔口,怎麼走你會蒙掉,立刻科技就會幫助你。
這是咱們作的針系統,用深度學習開發圖像識別技術,用低成本的攝像頭幫你完成任務。徹底沒有人的自動駕駛不是咱們追求的目標,這是很難作到,十年以後也許可以作到,中間是逐步實現的過程,它從輔助駕駛開始,經過感知器通知司機發生了什麼情況。整個系統是讓人去享受交通系統帶來的便捷和安全,但並非取代人。咱們強調的是人車一體的駕駛,這就回到了一開始個人演講題目——對人機關係的思考。
偉大的技術之因此偉大,在於讓每一個平凡的人更偉大
咱們稍微回顧一下人工智能的發展原點,這個原點很大意義上是因爲圖靈測試,人工智能是研發可以取代人的機器,這樣作是否是好,咱們要有本身的一些思考。咱們在百度過去作的產品裏面,能夠稍微反思一下,有兩個產品。第一個是PK大咖,一個普通的人給本身照張像,找到很像的明星,用戶很歡迎,每一個普通人都有作明星的夢想。另一個產品是拍照寫詩,圖像識別之後不光是識別,它還生成一首詩,更加複雜和先進。但從用戶的反映來說,用戶對這個拍照寫詩的興趣不是那麼大,爲何呢?由於這個產品只是去顯示機器有多麼的偉大,跟每一個普通用戶到底有什麼關係。
咱們看另一個例子,左邊是人工智能歷史上里程碑式的進展——IBM的深藍,它下象棋的能力可以達到人類冠軍的水平,後面IBM什麼事情也沒有發生。另一邊也是人工智能技術,就是搜索引擎。搜索引擎使得在北京的一個小孩子,跟在遙遠山村的小孩子只要有網絡,獲取知識的能力是同樣的,一個在山村的小孩子也能夠獲取知識,能夠有夢想。這個技術實際上對社會產生了巨大影響。
咱們回到一開始開場的視頻,這個自行車能夠跟着你走。你跑步的時候,衣服能夠放在上面,水能夠放在上面,本身能很輕鬆地跑。或者你在何時吹一個口哨,它能夠跟隨你跑進房間。你們想到什麼,這是車嗎?我想大家在座的答案跟我想的是同樣,它像是一個小黑馬駒。因此說這個是咱們對人機關係的一個思考。
咱們認爲偉大的技術之因此偉大,不是說讓機器更偉大,它最重要的意義在於讓每一個平凡的人更偉大,更有創造力,他的生活更加美好。
最後我修改引述毛主席的一句語錄:世界是咱們的,它也是機器人的。可是歸根到底它是屬於可以創造機器人,可以和機器人和諧共處而且利用機器人爲我所服務的人的,謝謝你們。