谷歌技術第一人 - Jeff · Dean丨思否觀察

clipboard.png

Jeff 的成長曆程

Jeff Dean 於 1968 年 7 月出生於夏威夷。他的父親 Andy 是一名熱帶疾病研究員;母親 Virginia Lee 是一位醫學人類學家,會說六種語言。程序員

爲了好玩,Jeff 的父親曾帶着小 Jeff 一塊兒設計了一臺 IMSAI 8080 工具包電腦,他們在機器上進行焊補更新,掌握了機器的每一個零件。算法

13歲時,他跳過了 8 年級最後三個月的課程,去索馬里西部的一個難民營作義工。後來,在高中時,他開始爲流行病學家編寫了一個名爲 Epi Info 的數據收集程序;這個工具後來成爲野外工做的一個標準工具,最終以十幾種語言分發了幾十萬份。瀏覽器

clipboard.png
美國疾病控制與預防中心運營的一個網站「the Epi Info Story」上 Jeff Dean 高中畢業時的照片網絡

Jeff 的博士期間主要研究編譯器,這是一種將人類編寫的代碼轉換成針對計算機優化的機器語言指令的軟件。框架

谷歌的高級副總裁 Alan Eustace 說:「就性感程度而言,編譯器至關無趣。可是另外一方面,它會讓你‘很是接近機器’。」可能受「編譯器」的影響, Jeff 也變得「很是接近機器」,他的摯友 Sanjay 就曾說過:「在編寫代碼時,Jeff 會有一個模型,他幾乎能夠半自動化的思考全部細微的狀況。」機器學習

咱們都知道,谷歌的工程師是分級別的,從 1 級 到 10 級。編輯器

clipboard.png

最底層的 1 級是 IT 支持人員;2 級是剛從大學畢業的學生;3 級一般擁有碩士學位;達到 4 級須要幾年時間,或者一個博士學位;6 級工程師(前10%)的能力很是強,一般是項目主管;從 6 級升到 7 級須要很長時間的貢獻記錄;分佈式

8 級是首席工程師,是主要產品或基礎設施的負責人;9 級是傑出工程師,是備受尊敬之人。最高是 10 級的 Google Fellow,這其實更像是一種榮譽,能伴隨一輩子的一項榮譽,一般頒發給某一領域的世界領先專家。工具

Jeff 在這個分級外,他是谷歌的高級 Fellow(Senior Fellow),也是谷歌公司僅有的 2 位 11 級工程師之一。學習

谷歌技術第一人

華盛頓大學博士、美國工程院院士、ACM(計算機協會) fellow、清華大學AI研究院計算機學科顧問、AAAS(美國科學促進會)fellow。

名譽滿身的 Jeff Dean 在谷歌負責過許多大型項目,支持谷歌運行的超大規模計算框架 MapReduce 和機器學習的標誌性軟件 TensorFlow 就是在他的領導下開發的。

clipboard.png

有不少人認爲,Jeff Dean 的存在是谷歌如此強大的緣由,谷歌員工都把谷歌搜索驚人的速度歸功於他。

由於 Jeff Dean 實在太過強大,以致於硅谷工程師們編出了很多關於他有多牛的笑話,好比:

「編譯器歷來不給 Jeff Dean 編譯警告,而是 Jeff Dean 警告編譯器。」

「在 2000 年後段,Jeff 碼代碼的速度忽然激增了 40 倍,緣由是他把本身的鍵盤升級到了USB 2.0。」

「gcc 的 -O4 優化選項是將你的代碼郵件給 Jeff 重寫一下」

「Jeff Dean 的鍵盤多達兩個鍵:1 和 0。」

「當 Jeff 聽 MP3 時,他查看其中的二進制內容而後在他腦子裏進行音頻解碼。」

玩笑歸玩笑,但自從 2011 年與吳恩達聯合創辦「谷歌大腦」後,Jeff Dean 深刻參與了谷歌各項人工智能技術的策劃與搭建,從 AutoML 到 TensorFlow 再到 TPU,不一而足,已然成爲了谷歌人工智能技術的代名詞。

clipboard.png

其實 Jeff Dean 剛從華盛頓大學的計算機博士畢業時,就已是美國頂尖的計算機科學家之一了。早在明尼蘇達大學讀計算機和經濟學本科時,Jeff Dean 的畢業論文內容就是研究如何並行訓練神經網絡,這是人工智能第一次熱潮中的熱門話題。

當 Jeff Dean 加入谷歌後,他的第一個主要工做是建立谷歌的廣告系統 Adsense —— 做爲谷歌搜索廣告,它是現在全部互聯網廣告的原型,其重要性簡直不言而喻。

以後,Jeff Dean 又用了四五年的時間來開發谷歌的檢索、索引和搜索系統,利用著名的 Pagerank 搜索算法,一舉成爲最優秀的搜索引擎公司。

在此以後,Jeff Dean 一直在和 Sanjay Ghemawat 等同事一塊兒開發谷歌用來存儲和處理大型數據集與作構建搜索索引或處理衛星圖像等事情的軟件基礎設施。2009 年,Jeff Dean 當選美國工程院院士。

2011 年,正是現在這波人工智能狂潮的開端之年。2011 年初,Jeff Dean 與吳恩達主導建立了「谷歌大腦」(Google Brain)這一奠基了谷歌人工智能領先地位的重要部門,此後又相繼有Greg Corrado、Quoc Le、Geoffrey Hinton、Ian Goodfellow 等重量級大牛的加入。

谷歌大腦構建起了基於大規模分佈式運算和大數據的谷歌大腦的基礎體系,並運用深度神經網絡技術,將人工智能在谷歌產品中的運用帶上了新的臺階。

這其中最爲出名的一個例子就是,2012年時,Jeff Dean 與吳恩達的團隊經過深度學習技術,成功讓 16000 箇中央處理器核心在學習 1000 萬張圖片後,成功在 YouTube 視頻中認出了貓的圖像,這在當時業界引發了極大的轟動。

此後,他又領導開發了谷歌機器學習的標誌性軟件 TensorFlow、支持谷歌運行的超大規模計算框架 MapReduce 等重要項目。2015年11月,TensorFlow 正式開源發佈,目前已是深度學習領域佔據絕對統治地位的框架。

Jeff Dean 表示,做爲谷歌總體人工智能計劃的一部分,谷歌大腦團隊致力於經過研究和系統工程,提高人工智能的技術水平。在過去的幾年裏,谷歌大腦在提高機器智能這個長期研究項目上繼續取得進展,並與谷歌和 Alphabet 的多個團隊合做,使用研究成果來改善人們的生活。

谷歌雙子星

開頭咱們提到,Jeff 是谷歌公司僅有的 2 位 11 級工程師之一,另外一位就是他的摯友,和他並稱爲「谷歌雙子星」的 —— Sanjay。

clipboard.png

《紐約客》雜誌去年曾發表長文,描寫了谷歌公司這兩位最重要的程序員鮮爲人知的友情故事:Jeff Dean 和 Sanjay Ghemawat。兩人的友誼已經持續20年,他們都是天才的程序員,工做上是最默契的搭檔,生活上情同手足

SanJay 喜歡清靜,在谷歌,他的周圍老是籠罩着神祕氣氛。他雖然沉默寡言,但思路異常清晰。在他的桌子上,放着一堆 Mead 筆記本,這些筆記本能夠追溯到 20 年前,裏面寫滿了整齊的清單和示意圖。他喜歡用鋼筆和草書寫字。雖然不多翻閱之前的筆記本,書寫也只是爲了思考。

不論是在谷歌內部仍是媒體的宣傳當中,Jeff 的名氣都要比 Sanjay 大得多。但對於熟悉他們兩人的人來講,Sanjay 絕對是不輸 Jeff Dean 的天才,而且兩我的很是互補。

clipboard.png

在生活中,Jeff 更外向,Sanjay 更內向。在代碼中,狀況正好相反。Jeff 的程序設計使人眼花繚亂,他能迅速勾勒出使人吃驚的想法,但因爲編得很快,代碼可能令讀者費解,而 Sanjay 的代碼則易於理解。

在一塊兒工做的這 20 年,他們沒有互相提升過嗓門,靠着一種獨有的默契相互成就。紐約客的長篇報道中就講過一些他們之間有意思的故事。

一個週一的早晨,Jeff 和 Sanjay 站在谷歌人工智能部門所在的 40 號樓的廚房裏。在他們身後,一塊白板上寫滿了矩陣代數;桌上放着一篇關於無監督對抗網絡的論文。Jeff 穿着一件褪了色的 T 恤和牛仔褲,看上去像一個改過自新的海灘流浪漢;Sanjay 穿着毛衣和灰色褲子。明亮的窗戶映出一排高大的松樹,遠處是一片田野。在小廚房的櫃檯上,咖啡機嗡嗡做響。

喝完卡布奇諾後,他們走到電腦前。Jeff 把一張椅子從本身凌亂的桌子邊拉到 Sanjay 的桌子旁,Sanjay 的桌子則一塵不染。他把一隻腳擱在文件櫃上,身子日後一靠,Sanjay 在他們面前的屏幕上工做。他打開了四個窗口:左側是一個Web瀏覽器和一個終端,用於運行分析工具;右側是文本編輯器Emacs中的兩個文檔,一個是待辦事項列表和筆記本的組合,另外一個則盡是各類顏色的代碼。Sanjay的筆記本就放在電腦旁。

「好了,咱們要作什麼?」Sanjay 問道。

「我想咱們正要看 TensorFlow Lite 的代碼大小,」Jeff 說。

這是一個機器學習的新軟件項目,Jeff 和 Sanjay 擔憂它過於臃腫;像圖書編輯同樣,他們想要削減代碼量。爲此,他們構建了一個須要優化的新工具。

「我得看看它有多慢,」Sanjay 說。

「超級慢,」Jeff 說。他身體前傾,仍然很放鬆。

「120 千字節,大概是 8 秒。」Sanjay說。

「12 萬個堆棧調用,」Jeff 說,「不是千字節。」

「額, 千字節的文本,應該是。」Sanjay 說。

「好吧,個人錯。」Jeff 說。

「我不太清楚應該爲一個單元的大小選擇什麼門檻。」Sanjay 說,「0.5 兆字節?

「看起來不錯,」Jeff 說。Sanjay 開始敲代碼,Jeff 的目光放在了屏幕上。「因此你的意思是,若是它比那個大,咱們就取樣……」他沒有說完;Sanjay 用代碼回答了他。

很快他們到達了一個小小的里程碑,Sanjay 輸入一個命令來測試進展。他看起來疲憊不堪,在程序運行時他 check 了一下郵件。測試結束了,他也沒有注意到。

「嘿,」Jeff 說。他打了個響指,而後指向屏幕。

雖然日常談話時他常常講笑話和雙關語,但在電腦前,他就變得執拗、粗魯,意見也常常合不來。Sanjay 對此泰然處之。當他以爲 Jeff 動做太快時,他會把雙手從鍵盤上擡起來,攤開手,好像在說:「停一下。」(若是打個比方,Jeff是油門,Sanjay就是剎車。)

這是他們最接近爭論的時候了。

表面上看,他們的工做都是細枝末節。然而,他們的代碼在整個谷歌公司範圍運行。他們所擔憂的千字節或是微秒的問題會在世界各地的數據中心被放大無數倍。

有時,Jeff 回到家會告訴他的女兒們,「Sanjay 和我今天把谷歌搜索速度提升了 10%。」

後話

谷歌 CEO Sundar Pichai 曾說過「谷歌將會變成一家人工智能優先的公司」,做爲系統和基礎設施組(Systems and Infrastructure Group)的高級成員,谷歌的「惟一黑科技」,Jeff 和他的團隊,多是實現這個目標不可或缺的一部分了。

除了工做,Jeff Dean 的人生目標之一是在每一個大陸上踢足球和籃球。到目前爲止,他已經在北美,南美,歐洲,亞洲和非洲這樣作了。不過,我擔憂南極洲可能會很艱難,但隨着技術的進步、科技的發展,誰又說的準呢?

部分素材來源:

The New Yorker:《The Friendship That Made Google Huge》

Google AI Blog:《Looking Back at Google’s Research Efforts in 2018》

機器之心:《Jeff Dean的激盪人生:我和Sanjay在同一臺電腦上寫代碼》

量子位:《獨家專訪Jeff Dean:TensorFlow不追求一家獨大》

知乎話題:有誰能夠介紹一下谷歌大牛Jeff Dean以及與他相關的事蹟麼?

關注 SegmentFault 官方公衆號 得到更多精彩諮詢
更有官方周邊(微軟、谷歌、GitHub 等)、技術圖書、趣味貼紙等小禮物免費領取哦!

圖片描述

相關文章
相關標籤/搜索