昨天,是1024程序員節。在這個「攻城獅」自帶光芒的日子裏,阿里妹請來AI大神賈揚清,做爲一位開發者,聊一聊他本身的開發者經歷,但願對你有所啓發。java
深度學習框架Caffe 做者,TensorFlow 做者之一,曾任 Facebook AI 架構部門總監,負責前沿 AI 平臺的開發,Facebook 各產品部門 AI 平臺的支持以及前沿機器學習系統研究。加州大學伯克利分校計算機科學博士學位、清華大學碩士學位和學士學位。python
當我以爲正在作的事情有意思,
我就以爲投時間在裏頭是對的。程序員
阿里妹:你們對你的我的經歷特別感興趣,這麼年輕來到阿里,想了解你是何時開始編程的?大學、研究生、博士分別學了什麼?算法
賈揚清:其實我學編程還挺晚的。初三的時候,有一臺計算機,我以爲挺有意思的,這時候開始接觸電腦。大學的時候我想報相關的專業,清華計算機的分數線很是高,我就去了自動化線。我在本科學的是正常的課程,到了研究生階段纔開始學習機器學習相關的內容。當時有一句話是說:機器學習在80%的時間裏解決80%的問題,但咱們不知道哪80%的時間解決了哪些80%的問題。當時你們都很沮喪,想着畢業可能就失業了,還不如學系統或是數據庫,至少有工做的機會。後來是由於興趣,就一直堅持下來了,再後來去伯克利讀PHD。博士期間已經在作計算機視覺的研究。要說正式開始很是認真的編程的話,Caffe 應該算是我第一個C++的項目。數據庫
阿里妹:你認爲你是一個智力超羣的人仍是學習刻苦的人?編程
賈揚清:我以爲我智商沒過高,可能仍是由於興趣,我也是相對比較懶的人,可是幹活仍是乾的。我基本上7點起來,半夜還在作。當我以爲個人事兒特別有意思,那我就以爲投時間在裏頭是對的。網絡
這是一個值得投入的方向。架構
阿里妹:Caffe 是在什麼場景下開發的這個框架,而且選擇開源的,開發這麼一個複雜的計算框架中遇到最大的坑是什麼?框架
賈揚清:當時咱們是想解決一個現實的問題,AelxBnet 出來以後,一直沒有一個通用的讓咱們作科研的像 cuda-covnet 這樣的一個平臺,你們若是去看 cuda-covnet的話,是很難作擴展的。因此,當時我和伯克利的其餘研究生是想解決本身的痛點:怎樣來訓練和設計深度學習的網絡?機器學習
開源的緣由是咱們以爲咱們有這樣的一個問題,那麼斯坦福確定也有,清華也有,其餘人確定也是有這樣的一個痛點。後來,咱們基於共享的考慮因素就把它放出來了,可能也是由於這個緣故,正好踩到了點。
若是要說坑的話,搞開發的時候,最痛苦的事情是怎樣來Debug。最開始的時候沒有測試,後來咱們跟之前在谷歌和其餘的科技公司的朋友談了一些測試框架。咱們把測試的東西弄起來以後,寫完Code跑一遍測試就能夠了,這是很大的收穫。
阿里妹:AI 對於解決常識或者推理的問題上面,會不會有重大的突破?包括知識圖譜跟深度學習學習如何結合?知識圖譜+圖計算是否是有但願的方向?
賈揚清:憑心而論,我不是圖計算的專家,只在讀Paper瞭解的程度。我以爲相似於知識圖譜,或者說用一個很老的詞叫專家系統,這方面的研究多是人工智能接下去的方向。之前作專家系統的時候,你們發現一個問題:我知道這個邏輯是怎麼樣的,可是輸入一個圖,怎麼樣從圖到邏輯。因此,這幾年人工智能在感知方面,像圖像識別、語音識別、天然語言理解,都是從各類各樣的輸入到所謂深度學習的階段,這方面深度學習的問題沒有解決。圖計算讓我想起我在作PHD的時候一個特別熱的領域叫機率圖模型,我以爲這是一個很值得投入的方向。
阿里妹:目前出現了無需大規模訓練集的深度學習算法模型,只是在精準度方面有必定的損失,請問這個方向是否有生命力?若是有,能夠應用在哪些場景中?
賈揚清:這仍是跟場景有關係,在一些影像識別等場景中的確有這樣的問題,當我要找一個特殊癌症的人,我不能滿世界找十個得癌症的人。因此說怎樣在小數據上作學習是一個問題。我也常常在反思,不必定須要拘泥於數據太少的問題,能夠經過一些方法來看能不能找到更多的數據。目前,小數據的收集還處於一個偏科研的方向,不少場景在真正落地的時候,仍是須要數據,可是這個方向仍是很是值得關注的。
阿里妹:你會推薦其餘技術上的同窗投入深度學習嗎?
賈揚清:我夫人是作 finance 和 accountant 的,有一天她說要學 SQL,在finance 中,不少人須要數據處理。後來,咱們就用一個週末的時間在一起學習。我以爲這件事和這個問題相似,你們能夠把深度學習當作一個工具。若是你在週末的時候把它當作練練手的項目來作,那還能夠,不然就不要搞了。有不少專業的,像作編譯器的同窗均可以幫忙搞定。怎麼投入學習呢?看一看數據科學家都在作什麼事情,若是本身有一堆數據的話,是否是能夠用深度學習的模型跑一跑,前提是做爲一個用戶來用,而不是做爲底層的開發者來用。我以爲深度學習是一個好東西,看你們怎麼來用,到底要不要造這個工具,有興趣的話固然能夠。
人應該是要想着怎樣作更好的工具,
而不是跟工具搶活。
阿里妹:AutoML是一個興起的領域,預期會有愈來愈多的平常工做被自動化,算法工程師應該如何選擇發展提高方向?
賈揚清:我認爲這是一個機會。當年C語言出來的時候,作彙編的同窗會以爲本身沒飯吃了。python、java出來後, C語言的人是否是沒飯吃了?其實都不是,而是說效率提高了。因此,我以爲 AutoML 更多的是讓咱們可以放手來考慮更多更上層的東西。因此人應該是要想着怎樣作更好的工具,而不是跟工具搶活。
阿里妹:對算法工程師來講有沒有更具體的,能夠發力的方向?
賈揚清:AutoML 應該是從2016年開始的, AutoML 最開始作搜索的時候,須要大量的資源,一開始你們開玩笑說AutoML 屬於谷歌秀肌肉的文章,一上來就說800個GPU跑了幾個月的時間,這事兒不現實的。咱們用一個相對批評的態度來看 AutoML 文章,他基本上就是跑一堆程序,最後跑出一個最好的。可是咱們隨機搜了一堆,它的效果能差多少?這個問題在研究領域也在討論。因此,AutoML 一個比較現實的方向是,怎麼樣在資源受限的狀況下,最快地尋找到一個最好的模型,這是一個傳統的像搜索等方面的問題。
阿里妹:在你的感覺中,國內工程師跟硅谷工程師有什麼差別點和共同點,對國內的一些工程師有什麼樣的建議?
賈揚清:我以爲我們國內的工程師最好的一點是特別認真,真的是特別認真。國外的工程師,有的時候到週末就找不到人,甚至星期五下午四點鐘就下班了。我來阿里以後,加入了騎自行車鍛鍊的羣,雖然尚未機會去,我以爲仍是須要平衡一下。硅谷工程師的想法更加天馬行空一點,願意投資到看似沒什麼用的地方去。這體如今公司的文化上面,硅谷的工程師把不少的工具作的挺好的,這無形當中就提高了咱們的效率,好比說像代碼的審查,怎樣作測試等。也不是批評我們本身,國外的公司可能在這方面的投資的範圍更大,這個反過頭來幫助了平常的工做效率,這多是我們應該向硅谷學習的一個地方。
人不是一臺機器,
但也正所以,
咱們才比機器更加溫暖。
阿里妹:AI 在落地改變人類發展的道路上,面臨的主要挑戰是什麼?
賈揚清:我以爲面臨的挑戰是咱們作 AI 的人不落地,這算是一個自我批評。你們作科研,不少時候像在象牙塔裏,須要解決的問題很簡單,就像 imagenet,最開始咱們說人工智能爆發的這一點,imagenet 圖像解壓縮以後250G左右的樣子,我拿個硬盤就解決了,即便硬盤不夠快,我拿個 SSD 也差很少也解決了。而後,咱們再看看應用到產品裏,有的時候是30億的照片,拿 SSD 就放不下。你再拿一個機器跑一跑試試,半年後說不定也沒戲。因此這個時候,算法須要真正的在不一樣的產品環境裏頭摸爬滾打。產品的數據,在必定程度上來講挺髒的,可是這事得作,作完了才能把算法推下去,有的時候作事不能太乾淨,這個是最主要的一個挑戰。AI 領域發展得很快,科研人員很快地衝到了產品裏,對軟件工程這方面的敬畏在必定程度上是不夠的,包括我本身,這是最大的挑戰。
阿里妹:知識爆炸的時代,將來應該如何選擇能夠長期投入的方向去研究?
賈揚清:這個有點難說,咱們當時搞人工智能的時候,開玩笑說,畢業就是失業。我以爲仍是要找一個本身感興趣的方向,如今你們都在作的,並不必定是最有意思的一個事兒。
有一次,咱們一羣博士生在討論日子要怎麼過。咱們的想法是找一個本身喜歡作的事情。若是是我不喜歡作的事情,即便掙錢了,也仍是在幹不喜歡乾的事。咱們當時的說法是:即便我作得不開心,即便我賺不了錢,但我以爲這事兒有意思就行。我有一位同窗是作天文的,雖然不賺錢,可是他作得很開心,這事兒就是我想作的事情。
2002年我剛入學的時候,咱們班主任跟咱們說了這樣一句話:「大家已經讀大學了,都已經在這兒了,大家要考慮到未來你畢業以後,年薪10萬是沒有問題的,養小孩是沒有問題的。大家要想一想,當溫飽解決了以後,你作事兒是否是開心?」我以爲這句話對個人觸動挺大,我一直都記得這句話。
阿里妹:若是推薦一本書給如今的開發者,你會推薦哪一本書?
賈揚清:做爲軟件工程師我常常有這樣一份沮喪:爲何別人老是不講邏輯?這種沮喪在我走上技術管理崗位之後愈來愈多,直到今天。戴爾卡內基的《人性的弱點》,從暢銷書的角度可能都已經被說爛了,不過我以爲它對像我這樣的技術人員來講,是一本特別值得讀的書:它用邏輯來說述邏輯以外的事情,同時向我展現了一系列爲人處世和共創成功的方法論。我2014年的時候第一次讀到這本書,感受它解決了我心底裏對於和人打交道的恐懼。乍一看,書中講到的事情彷佛都是一些技巧:如何使你更受歡迎,如何交朋友,如何增長賺錢的能力,等等;但一條主線貫穿始終:人做爲一種社會動物,有着喜怒哀樂,有着不一樣的個性,可是最終都但願得到相互的真誠,合做和理解。書中講到的無數種技巧,歸結起來,就是真心理解他人,尊重他人。人不是一臺機器,但也正所以,咱們才比機器更加溫暖,共勉。
本文來自雲棲社區合做夥伴「阿里技術」,如需轉載請聯繫原做者。