https://www.leiphone.com/news/202002/NMa5cO0x8VCLunMn.htmlhtml
本科畢業於清華姚班,博士畢業於普林斯頓大學,現在年僅31歲的馬騰宇,做爲 AI 學界的一顆新星正冉冉升起。算法
馬騰宇目前擔任斯坦福大學助理教授,其主要研究興趣爲機器學習和算法方面的研究,課題包括非凸優化、深度學習及其理論、強化學習、表示學習、分佈式優化、凸鬆弛、高維統計等。網絡
2017 年,清華 「姚班」 創立者、中國科學院院士、中國首位圖靈獎得主姚期智先生在談及姚班教育的時候,曾提到:iphone
「在學界的,咱們有好幾個作人工智能的學生,已經在大學任教的有兩個,一個是在美國的杜克大學,一個是在美國的斯坦福大學作教授,他們都從事人工智能理論基礎方面的工做。他們在過去的四五年,在人工智能理論方面已經很是很是出色,否則他們也不會被僱到這麼有名的大學去,尤爲是馬騰宇,他剛剛畢業,可以被僱到斯坦福去,無論是中國學生仍是外國學生都是很是少的。……他們確實能夠說在人工智能領域是先驅,未來必定會在該領域留下很是深入的痕跡。」機器學習
1.
馬騰宇對算法理論的興趣始於姚班。據馬騰宇介紹,讓他印象最深的是當時姚期智先生爲當時姚班大一新生所開設的一門課程《mathematics for computer science》,姚期智在這門課程中,每一個章節都會用一兩個最爲經典的案例讓學生很是快速地意識到,爲何在計算機領域數學很是有用。姚期智在這門課程中並無循序漸進系統地介紹計算機理論領域的細節問題,最重要的則是激發起學生對計算機理論問題的興趣。這就至關於在計算機理論研究這場尋寶遊戲中,激發起學生們對「寶藏」的渴望,至於如何尋找這些寶藏,學生們則自會摸索。這對姚班學生的興趣培養很是重要,馬騰宇也深受影響。分佈式
馬騰宇是清華姚班 2008 級畢業生佈局
像以前以及以後的學長和學弟以及身邊的同窗同樣,從姚班畢業的馬騰宇在本科期間醉心於計算機算法的研究。2012年本科畢業後,他選擇了在普林斯頓讀博, 師從的Sanjeev Arora教授。學習
2.
馬騰宇開始讀博的時間恰逢其時。2012年,Hinton和他的學生在ImageNet比賽中憑藉AlexNet遠超第二名10個百分點,由此人類進入了人工智能的新時代 —— 以神經網絡爲表明的深度學習時代。Sanjeev做爲算法領域的領軍人物,具備極爲敏銳的嗅覺,意識到機器學習(特別是深度學習)將成爲一個具備潛力的領域,所以從2012起便開始佈局機器學習算法的研究。馬騰宇進入普林斯頓後,選擇了機器學習算法,與鬲融等人一塊兒進行非凸優化的研究。優化
在2012年的時候,大多數人還在用傳統方法來作優化問題,這些基本上都是凸優化問題。而在深度學習的時代,算法一般須要經過解決一些非凸優化問題來找到最優的神經網絡參數。理論上非凸優化是一個NP-hard問題,但實際中即便很是簡單的算法也能表現很好。其中緣由卻少有人瞭解。馬騰宇與鬲融等人是最先一批專一於解決這一問題的研究者。隨後正是憑藉對非凸優化問題的系統研究,馬騰宇在 2018 年得到了ACM博士論文獎榮譽獎(Honorable Mentions),而鬲融也在2019年得到了斯隆研究獎。ui
馬騰宇的博士論文,獲2018 ACM 博士論文榮譽獎
3.
一個好的導師,對一個學者的研究生涯相當重要,由於導師的學術價值觀和方法論會深入影響其弟子在之後研究生涯中的態度。Sanjeev無疑是一位好的導師,他所帶的學生畢業後大多都去到了美國頂尖大學任教,例如鬲融畢業後去到了杜克大學。
馬騰宇(2015),Source: princeton news
在普林斯頓期間,導師Sanjeev對馬騰宇的影響也是極大的。馬騰宇對他的評價是「Sanjeev是一個‘true scientist’」:
「Sanjeev是真的爲了科學在作科研。對他關心的問題,他會細扣全部的細節,從證實,到實驗,到寫文章不允許一丁點的錯誤存在。另外,Sanjeev也很是的積極,很是的有耐心,在一個新問題上,他經常會持之以恆,從各類可能的角度去嘗試,即便最初全部的嘗試都失敗了,他也仍然會一遍又一遍地去嘗試新的想法,直到最終成功。這是我從他那裏學到的很是重要的一件事情。」
4.
固然,導師的影響只是成功的一個方面,馬騰宇自身的天分和勤奮讓他在普林斯頓的五年時間裏收穫良多。
2014年,馬騰宇得到了西蒙斯研究生獎(理論計算機科學方向),隨後2015年得到了IBM博士獎學金,2016年得到了NIPS 最佳學生論文獎,2018年得到了COLT 最佳論文獎,其博士畢業論文也得到了ACM 博士論文榮譽獎,並在當年夏季收到了來自全球計算機Top 5中的四所高校(MIT、CMU、斯坦福、華盛頓大學)的 Offer 並最終選擇去了斯坦福。
一次的成功或許只是巧合,系列的成功則是實力和潛力的證實。
NIPS'16最佳學生論文,2018年修訂版
以2016年NIPS最佳論文獎爲例,這項工做主要是在講爲何能夠用 non-convex optimization 作Matrix Completion。Matrix Completion經常被應用在推薦系統當中。理論能夠分析的算法都比較慢,而實際中使用的算法都基於non-convex optimization, 卻沒有理論保證和理解。所以就存在一個大的開放性問題:爲何non-convex optimization能夠解決這個問題?
馬騰宇等人首先在這篇工做中回答了這一問題。而事實上,馬騰宇與鬲融、Jason D. Lee三人從開始作這項工做到提交論文,先後只用兩個月不到的時間。雖然如此,這倒是長久的積累,馬騰宇差很少在一年前便意識到這個理解non-convex optimizatio的重要性,並偶爾嘗試從不一樣的角度去解決它,但一直沒有大的收穫,直到2月份他看到一篇文章中的一個小技巧,忽然靈感而至,很快便將這個問題解決了。對於這份經歷,馬騰宇總結到
「我以爲作科研的困難主要有三個:1)找到一個重要的方向;2)找到一個能夠解決的問題;3)同時有足夠的技術儲備和技術創新。」
COLT'18 最佳論文
2018年,馬騰宇與Yuanzhi Li 、Hongyang Zhang三人合做的論文《Algorithmic Regularization in Over-parameterized Matrix Sensing and Neural Networks with Quadratic Activations》發表在COLT上,並得到了最佳論文獎。而這篇論文與NIPS‘16的最佳學生論文相似,從開始作到投稿,先後仍然只用兩個月的時間。在這篇主題爲「正則化」的工做中,馬騰宇他們直接follow了以前的一篇工做,但那先前的工做只能解決一個特殊問題,而馬騰宇意識到若是沿着他們的思路作,可能會變得愈來愈複雜。意識到這一點自己很是重要。他說:
「作科研,很重要的一點是去理解其餘技術爲何本質上不可行。不少時候,科研之因此思路比較慢,緣由在於你有許多選擇,你不知道哪一個選擇是好的,也不知道哪一個選擇是壞的。這很糟糕。一旦你知道哪一個選擇是壞的,剩下可選的好的就很少了。因此作科研,很重要的一步是排除是壞的選擇;其次是,要知道它爲何是壞的,這也比較重要,由於你若是不知道它爲何是壞的話,就很難把它變成好的。
一個想法,若是你能知道它行不通的根本緣由,通常狀況下就不會很難經過針對性地修改這個想法獲得一個更好的方案。因此咱們這項工做模式上就是:咱們發現一個想法沒有效果,而後理解了這個想法失敗的的緣由,修正並提出一個新的想法;若是新的想法還解決不了問題,就找到問題,修正,循環往復,就是這樣。」
2018 ACM 博士論文榮譽獎頒獎, Source: princeton news
5.
2018年對29歲的馬騰宇來說是一個豐收年,COLT最佳論文、ACM博士論文榮譽獎、多所頂尖高校發出的橄欖枝……然而,受Sanjeev的影響,馬騰宇對於這些榮譽表現的極爲淡然。他表示
「其實沒有太大的感受。首先這是你們對個人工做的一個確定,可能的緣由是個人博士論文是比較早的一系列試圖理解爲何non-convex optimization 能夠解決機器學習的問題的工做;在此以前幾乎沒有這方面的研究。……但作科研,你的reward(受益或回報) 每每是很是滯後的。博士論文是五年工做的總結, 包括COLT’18 的最佳論文,實際上是咱們在2017年作出來的。作科研要考慮長期的reward,而不要考慮短時間的reward。」
然而,毋論馬騰宇是否淡然,科研早期的榮譽對於一個科學家的成長倒是必不可少的,這可讓年輕學者在攀巖科研高峯中充滿信心。
6.
而另外一方面,「long-term」,正是馬騰宇作科學研究的關鍵詞。當談到他的方法論時,馬騰宇說,
「從科研的style來說,我比較在意的是long term impact,個人課題選擇也會受到這方面的影響。」
在科研的實踐當中,關注長期影響力是一個研究者可否成爲真正科學家的關鍵一步。以如何看待失敗的嘗試爲例,關注長期影響力的人會更積極地看待失敗,由於從短時間來看是失敗了,但從長期來看這是有益的,失敗了沒有關係,若是你可以知道它爲何失敗,在不少狀況下你會改變它,讓它變成一個成功的狀況。
馬騰宇關於Non-Convex Optimization 的報告(2017), Source: Allen School Colloquia
馬騰宇表示:「在不少狀況下,若是我可以真正地知道我爲何失敗,不少狀況下我都可以把它變成一個成功的狀況。不過更多的狀況是,我只能理解一點點爲何我會失敗,而後從中汲取一點點的經驗,但長期積累,我會理解爲何整個過程都不work。這樣的話,我就可以摸索出另一套思路。」
當前人工智能面臨諸多困境,馬騰宇以十年爲期,他認爲人工智能的理論基礎仍然是一個很是大的困難,咱們目前還很難理解算法到底作了什麼,所以如何理解算法,如何更好地設計算法成了馬騰宇最爲關注的問題。正如他的導師Sanjeev,面對這樣一個宏大的問題,他試圖從各類角度(包括最優化、泛化、正則化等)進行逼近。如何經過理論思考來幫助機器學習,正是馬騰宇的「long-term」問題。
他表示,儘管當前的機器學習研究過程當中,實驗指導每每重於理論思考的指導。但長遠來看,在隨後的幾年中,理論思考的指導價值將愈來愈凸顯。正如在博士初期選擇佈局無人問津的非凸優化研究同樣,馬騰宇做爲斯坦福的助理教授,如今也在佈局機器學習理論的研究,一個更大的佈局。
固然,long-term並不意味着「空中樓閣」,十年寫一篇文章。爲了長期的計劃,馬騰宇在實驗指導vs理論思考中取得一個平衡, 把這個long-term 分爲了一系列很是小的問題,表如今成果方面即是一個個的topics,一篇篇的論文。目前馬騰宇在斯坦福帶着 5 名博士生以及數名碩士生,正每一年發表十幾篇論文的速度一步步邁向這個目標。
雷鋒網(公衆號:雷鋒網)報道。雷鋒網雷鋒網
雷鋒網原創文章,未經受權禁止轉載。詳情見轉載須知。