賈揚清：把生命浪費在有意思的事情上

時間 2019-11-09

標籤生命浪費有意思事情简体版

原文原文鏈接

昨天，是1024程序員節。在這個「攻城獅」自帶光芒的日子裏，阿里妹請來AI大神賈揚清，做爲一位開發者，聊一聊他本身的開發者經歷，但願對你有所啓發。java

深度學習框架Caffe 做者，TensorFlow 做者之一，曾任 Facebook AI 架構部門總監，負責前沿 AI 平臺的開發，Facebook 各產品部門 AI 平臺的支持以及前沿機器學習系統研究。加州大學伯克利分校計算機科學博士學位、清華大學碩士學位和學士學位。python

01 人生經歷

當我以爲正在作的事情有意思，
我就以爲投時間在裏頭是對的。程序員

阿里妹：你們對你的我的經歷特別感興趣，這麼年輕來到阿里，想了解你是何時開始編程的？大學、研究生、博士分別學了什麼？算法

賈揚清：其實我學編程還挺晚的。初三的時候，有一臺計算機，我以爲挺有意思的，這時候開始接觸電腦。大學的時候我想報相關的專業，清華計算機的分數線很是高，我就去了自動化線。我在本科學的是正常的課程，到了研究生階段纔開始學習機器學習相關的內容。當時有一句話是說：機器學習在80%的時間裏解決80%的問題，但咱們不知道哪80%的時間解決了哪些80%的問題。當時你們都很沮喪，想着畢業可能就失業了，還不如學系統或是數據庫，至少有工做的機會。後來是由於興趣，就一直堅持下來了，再後來去伯克利讀PHD。博士期間已經在作計算機視覺的研究。要說正式開始很是認真的編程的話，Caffe 應該算是我第一個C++的項目。數據庫

阿里妹：你認爲你是一個智力超羣的人仍是學習刻苦的人？編程

賈揚清：我以爲我智商沒過高，可能仍是由於興趣，我也是相對比較懶的人，可是幹活仍是乾的。我基本上7點起來，半夜還在作。當我以爲個人事兒特別有意思，那我就以爲投時間在裏頭是對的。網絡

02 深度學習技術

這是一個值得投入的方向。架構

阿里妹：Caffe 是在什麼場景下開發的這個框架，而且選擇開源的，開發這麼一個複雜的計算框架中遇到最大的坑是什麼？框架

賈揚清：當時咱們是想解決一個現實的問題，AelxBnet 出來以後，一直沒有一個通用的讓咱們作科研的像 cuda-covnet 這樣的一個平臺，你們若是去看 cuda-covnet的話，是很難作擴展的。因此，當時我和伯克利的其餘研究生是想解決本身的痛點：怎樣來訓練和設計深度學習的網絡？機器學習

開源的緣由是咱們以爲咱們有這樣的一個問題，那麼斯坦福確定也有，清華也有，其餘人確定也是有這樣的一個痛點。後來，咱們基於共享的考慮因素就把它放出來了，可能也是由於這個緣故，正好踩到了點。

若是要說坑的話，搞開發的時候，最痛苦的事情是怎樣來Debug。最開始的時候沒有測試，後來咱們跟之前在谷歌和其餘的科技公司的朋友談了一些測試框架。咱們把測試的東西弄起來以後，寫完Code跑一遍測試就能夠了，這是很大的收穫。

阿里妹：AI 對於解決常識或者推理的問題上面，會不會有重大的突破？包括知識圖譜跟深度學習學習如何結合？知識圖譜+圖計算是否是有但願的方向？

賈揚清：憑心而論，我不是圖計算的專家，只在讀Paper瞭解的程度。我以爲相似於知識圖譜，或者說用一個很老的詞叫專家系統，這方面的研究多是人工智能接下去的方向。之前作專家系統的時候，你們發現一個問題：我知道這個邏輯是怎麼樣的，可是輸入一個圖，怎麼樣從圖到邏輯。因此，這幾年人工智能在感知方面，像圖像識別、語音識別、天然語言理解，都是從各類各樣的輸入到所謂深度學習的階段，這方面深度學習的問題沒有解決。圖計算讓我想起我在作PHD的時候一個特別熱的領域叫機率圖模型，我以爲這是一個很值得投入的方向。

阿里妹：目前出現了無需大規模訓練集的深度學習算法模型，只是在精準度方面有必定的損失，請問這個方向是否有生命力？若是有，能夠應用在哪些場景中？

賈揚清：這仍是跟場景有關係，在一些影像識別等場景中的確有這樣的問題，當我要找一個特殊癌症的人，我不能滿世界找十個得癌症的人。因此說怎樣在小數據上作學習是一個問題。我也常常在反思，不必定須要拘泥於數據太少的問題，能夠經過一些方法來看能不能找到更多的數據。目前，小數據的收集還處於一個偏科研的方向，不少場景在真正落地的時候，仍是須要數據，可是這個方向仍是很是值得關注的。

阿里妹：你會推薦其餘技術上的同窗投入深度學習嗎？

賈揚清：我夫人是作 finance 和 accountant 的，有一天她說要學 SQL，在finance 中，不少人須要數據處理。後來，咱們就用一個週末的時間在一起學習。我以爲這件事和這個問題相似，你們能夠把深度學習當作一個工具。若是你在週末的時候把它當作練練手的項目來作，那還能夠，不然就不要搞了。有不少專業的，像作編譯器的同窗均可以幫忙搞定。怎麼投入學習呢？看一看數據科學家都在作什麼事情，若是本身有一堆數據的話，是否是能夠用深度學習的模型跑一跑，前提是做爲一個用戶來用，而不是做爲底層的開發者來用。我以爲深度學習是一個好東西，看你們怎麼來用，到底要不要造這個工具，有興趣的話固然能夠。

03 職業成長

人應該是要想着怎樣作更好的工具，
而不是跟工具搶活。

阿里妹：AutoML是一個興起的領域，預期會有愈來愈多的平常工做被自動化，算法工程師應該如何選擇發展提高方向？

賈揚清：我認爲這是一個機會。當年C語言出來的時候，作彙編的同窗會以爲本身沒飯吃了。python、java出來後， C語言的人是否是沒飯吃了？其實都不是，而是說效率提高了。因此，我以爲 AutoML 更多的是讓咱們可以放手來考慮更多更上層的東西。因此人應該是要想着怎樣作更好的工具，而不是跟工具搶活。

阿里妹：對算法工程師來講有沒有更具體的，能夠發力的方向？

賈揚清：AutoML 應該是從2016年開始的， AutoML 最開始作搜索的時候，須要大量的資源，一開始你們開玩笑說AutoML 屬於谷歌秀肌肉的文章，一上來就說800個GPU跑了幾個月的時間，這事兒不現實的。咱們用一個相對批評的態度來看 AutoML 文章，他基本上就是跑一堆程序，最後跑出一個最好的。可是咱們隨機搜了一堆，它的效果能差多少？這個問題在研究領域也在討論。因此，AutoML 一個比較現實的方向是，怎麼樣在資源受限的狀況下，最快地尋找到一個最好的模型，這是一個傳統的像搜索等方面的問題。

阿里妹：在你的感覺中，國內工程師跟硅谷工程師有什麼差別點和共同點，對國內的一些工程師有什麼樣的建議？

賈揚清：我以爲我們國內的工程師最好的一點是特別認真，真的是特別認真。國外的工程師，有的時候到週末就找不到人，甚至星期五下午四點鐘就下班了。我來阿里以後，加入了騎自行車鍛鍊的羣，雖然尚未機會去，我以爲仍是須要平衡一下。硅谷工程師的想法更加天馬行空一點，願意投資到看似沒什麼用的地方去。這體如今公司的文化上面，硅谷的工程師把不少的工具作的挺好的，這無形當中就提高了咱們的效率，好比說像代碼的審查，怎樣作測試等。也不是批評我們本身，國外的公司可能在這方面的投資的範圍更大，這個反過頭來幫助了平常的工做效率，這多是我們應該向硅谷學習的一個地方。

04 將來

人不是一臺機器，
但也正所以，
咱們才比機器更加溫暖。

阿里妹：AI 在落地改變人類發展的道路上，面臨的主要挑戰是什麼？

賈揚清：我以爲面臨的挑戰是咱們作 AI 的人不落地，這算是一個自我批評。你們作科研，不少時候像在象牙塔裏，須要解決的問題很簡單，就像 imagenet，最開始咱們說人工智能爆發的這一點，imagenet 圖像解壓縮以後250G左右的樣子，我拿個硬盤就解決了，即便硬盤不夠快，我拿個 SSD 也差很少也解決了。而後，咱們再看看應用到產品裏，有的時候是30億的照片，拿 SSD 就放不下。你再拿一個機器跑一跑試試，半年後說不定也沒戲。因此這個時候，算法須要真正的在不一樣的產品環境裏頭摸爬滾打。產品的數據，在必定程度上來講挺髒的，可是這事得作，作完了才能把算法推下去，有的時候作事不能太乾淨，這個是最主要的一個挑戰。AI 領域發展得很快，科研人員很快地衝到了產品裏，對軟件工程這方面的敬畏在必定程度上是不夠的，包括我本身，這是最大的挑戰。

阿里妹：知識爆炸的時代，將來應該如何選擇能夠長期投入的方向去研究？

賈揚清：這個有點難說，咱們當時搞人工智能的時候，開玩笑說，畢業就是失業。我以爲仍是要找一個本身感興趣的方向，如今你們都在作的，並不必定是最有意思的一個事兒。

有一次，咱們一羣博士生在討論日子要怎麼過。咱們的想法是找一個本身喜歡作的事情。若是是我不喜歡作的事情，即便掙錢了，也仍是在幹不喜歡乾的事。咱們當時的說法是：即便我作得不開心，即便我賺不了錢，但我以爲這事兒有意思就行。我有一位同窗是作天文的，雖然不賺錢，可是他作得很開心，這事兒就是我想作的事情。

2002年我剛入學的時候，咱們班主任跟咱們說了這樣一句話：「大家已經讀大學了，都已經在這兒了，大家要考慮到未來你畢業以後，年薪10萬是沒有問題的，養小孩是沒有問題的。大家要想一想，當溫飽解決了以後，你作事兒是否是開心？」我以爲這句話對個人觸動挺大，我一直都記得這句話。

阿里妹：若是推薦一本書給如今的開發者，你會推薦哪一本書？

賈揚清：做爲軟件工程師我常常有這樣一份沮喪：爲何別人老是不講邏輯？這種沮喪在我走上技術管理崗位之後愈來愈多，直到今天。戴爾卡內基的《人性的弱點》，從暢銷書的角度可能都已經被說爛了，不過我以爲它對像我這樣的技術人員來講，是一本特別值得讀的書：它用邏輯來說述邏輯以外的事情，同時向我展現了一系列爲人處世和共創成功的方法論。我2014年的時候第一次讀到這本書，感受它解決了我心底裏對於和人打交道的恐懼。乍一看，書中講到的事情彷佛都是一些技巧：如何使你更受歡迎，如何交朋友，如何增長賺錢的能力，等等；但一條主線貫穿始終：人做爲一種社會動物，有着喜怒哀樂，有着不一樣的個性，可是最終都但願得到相互的真誠，合做和理解。書中講到的無數種技巧，歸結起來，就是真心理解他人，尊重他人。人不是一臺機器，但也正所以，咱們才比機器更加溫暖，共勉。

本文做者：賈揚清

閱讀原文

本文來自雲棲社區合做夥伴「阿里技術」，如需轉載請聯繫原做者。

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。