編者按:6月26日,2014年國際機器學習大會(ICML)在北京國際會議中心完美落幕。做爲機器學習領域兩大頂尖年會之一,這是 ICML大會30多年來首次來到中國和遠東,在國內的機器學習界震動不小。身爲本次大會主席的卡耐基梅隆大學計算機系教授邢波(Eric Xing)爲此作了諸多努力。做爲在美國機器學習領域前沿爲數很少的華人學者,許多國內計算機專業學生渴望投身其門下。藉着這次大會的舉辦,咱們也有幸和Eric坐下來,面對面的聊一聊他對科研的態度以及對後輩們的建議。html
問:從生物學博士到計算機科學博士,再到機器學習領域的佼佼者,這樣的轉變是如何發生的?程序員
Eric:「爲何會選擇進入一個新的專業?由於興趣。當時對手頭作的研究項目興趣不夠,而同時又有其餘的東西讓本身很着迷,因此在完成前項工做後就選擇了轉變。如今回頭看,這樣的轉變在個人生活中並很多見,好比,我最近開始在作計算機系統相關的研究。操做系統跟機器學習是很不同的領域,這種轉變的距離和我以前的轉變同樣遠,但興趣使然。15年前,人工智能和機器學習在美國學術圈很冷門,中國人很少、美國人也很少,當時基於興趣選擇轉專業,如今也同樣。當選擇改變時,不要把它當個大事,要把生理和心理障礙壓到最低。」算法
問:很多人認爲,作科研極爲枯燥。你認爲這裏面有誤解嗎?數據庫
Eric:「確實有人以爲科研枯燥、與產品的結合不夠緊密,像是對將來的虛幻想象。這其中有一些誤解。不少人基於片面的理解或有限的經驗,簡單的把理論研究和應用研究對立起來,並由此產生一種膚淺的排他思想;好比有些「基礎研究」學者瞧不起「應用研究」學者,認爲後者不嚴格正統,或者有些業界的工程師程序員也鄙視大學裏的研究者,認爲後者不實用。抱有這種想法的人很難成爲領先的學者和工程師。其實計算機科研是最不枯燥的研究,優秀的計算機研究每每體現着理論和現實問題的緊密結合。它不是純粹推導公式、設計模型,證實定理;也不是埋頭編程,調參,試錯。嚴謹的計算機科研須要跟數學打交道,這可能對於某些人來講,有些枯燥;但對於另外一些人來講,這仍然頗有趣並使人興奮。事實上,谷歌的搜索引擎、微軟的Kinect等都是由基礎研究衍生出來的產品——當你把研究跟實際應用結合起來,興趣是很容易產生的。或許研究過程當中會比較理論,但咱們是基於現實應用問題來提出研究問題。當你但願用一個漂亮的方法(正規、嚴密,普適,可獨立重複的方法)解決問題時,你天然會使用數學手段;可是最後的實現、評估、證實等是從理論和實際應用兩個方面來出發,這樣就會頗有意思。編程
問:有傳聞說您天天只睡4-5個小時,作科研這麼忙嗎?網絡
Eric:「我不是爲了忙而忙,而是順其天然。就好像彈琴有的地方彈得快了後,慢了本身都很差意思,快反而是一種天然的節奏。有時候會更慢一些、有時候會更快一些,也沒有刻意去保持。固然,其實從生活質量來講,也沒有那麼可怕。我也有進行規律的健身鍛鍊,業餘愛好,跟家人一塊兒玩,等等,我不提倡把本身弄得很憔悴、不顧家庭或不跟朋友交往。如何作到呢?不要浪費時間。睡幾個小時是我的生理特徵,可是在不睡覺的時間裏,要怎麼用?大部分人在大部分時間處於什麼都沒作的狀態,他們既沒有作公事,也沒有作私事,但我基本上不存在這樣的時間,我要不就作一些跟工做有關的事,要不就抽空鍛鍊、彈琴,聽音樂,看書,,或跟家人一塊兒活動。雖然沒有一個明顯的工做到生活的某個切換點,但找準了工做和生活的節奏,仍是很天然。對於我來講,研究、健身等事情不是要‘堅持’才能作到的事兒,而是我火燒眉毛要去作,這些都不是很難受的事兒。」架構
問:國內很多學生都想當您的學生,那您是如何挑選學生的呢?框架
Eric:「首先我要經過你向同窗們對咱們工做的興趣表示感謝!我很但願能知足同窗們的願望。有時候,這不只僅是學生的問題,也是我本身的精力和資金的問題。在美國,招學生是一個至關昂貴的事情,每人每一年要資助近十萬美圓。個人組如今有將近20個學生,再大的話,錢也不夠,個人精力也不夠。我帶學生仍是比較認真的,好比每星期至少有一次討論,20個學生就有20次,一星期排下來也差很少了。在挑選學生的時候,我比較注重文化,風格,興趣的多樣性和平衡,而非單純的高產,不會偏重某個國家人特別多,也力求性別的平衡。機器學習
除了這些緣由,還須要一些研究興趣的匹配,以及研究以外的東西。我招學生的時候,可能會注重一我的的我的修養或人品——就是他/她做爲一個普通人的價值,而不只僅是做爲研究者所擁有的能力。研究方面的能力是能夠培養的,不管是跟着我仍是其餘老師,學生的能力都必定會有提升。研究的起點不見得非要高,可是對學生的我的性格或修養有要求,我我的比較喜歡學生在個人組裏產生正能量。更細緻地話,我比較看重這四點:分佈式
1、有獨立精神以及獨立思考的能力。不是說我師兄師姐在作什麼選題、最近最熱是什麼選題,我都去問問而後遵從。勇於卓爾不羣,堅持本身的觀點;但同時也謙虛理性,而非頑固不化。
2、要有一些理想主義。不是作每一件事都有一個精準的投資回報率,要有一些純粹爲了興趣和愛好而努力、爲了盡善盡美而下功夫的追求。享受過程,而不是苛求結果,把結果當成過程的副產品,有了很好、沒有也不沮喪,這樣才能真正享受過程。
3、誠實而豁達。有一種簡單、率真的性格,不能工於心計。
4、知書達理,有良好教養,禮貌,易於也樂於和別人共事。
我相信擁有以上四點的同窗能夠成爲我組裏很好的團隊成員。
問:每次您來微軟亞洲研究院作講座,老是座無虛席,人特多。您和微軟亞洲研究院有什麼淵源?
Eric:「微軟研究院一直以來都和CMU(卡耐基梅隆大學)有衆多的交流與合做。對於我我的而言,微軟亞洲研究院至今都是國內爲數很少的頂級計算機研究機構,培養的學生大都很是優秀。加上我在這裏有不少的朋友,他們也常常邀請我過來和同事學生們交流交流,我也都十分樂意,也學到不少東西。
問:最近在線教育(MOOC)比較火,不知道您有沒有打算在網上開機器學習相關課程?
Eric:「如今MOOC很火,也頗具爭議。從普及知識的角度,Coursera作了一件大好事。但做爲想對某個領域有深度瞭解的同窗來講,也必須對本身有一個清楚的定位。若是你的終極目標是對某個話題有必定了解,經過MOOC來學習是個還不錯的選擇。但若是你要以學習的某個方向爲職業的話,就須要更多考量。如今的年輕人比較容易從衆,可能會出現的一種狀況是,從極度自卑到極度膨脹的距離可能會變得很是短。我我的認爲,MOOC更重要的一個做用是普及教育,是掃盲用的。
然而做爲一個博士研究生,你是須要普及知識,仍是更高級的知識?我如今尚未加入在線教育,將來可能會,具體視CMU的政策而定。MOOC在普及知識的方面已經作得很是好了,但不見得是我最須要作的事情了。我嘗試提供一些更高端、更適合專業研究須要,聽衆少一點、技術含量更高一點的課,因此我最近把機率圖模型這門課錄像、並經過CMU放到網上。Daphne Koller教授也開過這門課,在MOOC上有,但個人課教得比較前沿、更難,內容更多些,進度也可能也快些,提供給已經有紮實基礎,須要深刻研究機器學習的學生。從此我還會公開一門高級機器學習課。「
問:機器學習、人工智能,如今火得不行。您以爲是由於它到時候該火起來了,仍是炒做的成分居多?
Eric:「兩者兼有吧。如今的確是到了機器學習的時代——計算機應用的需求超過了原來普通的編程、普通的數據庫所能提供的解決方案。數據很大,人確定處理不過來,數據庫不懂得提供一個足夠智能的處理服務。機器學習雖然也沒能提供解決方法,但它提供了一個大的思路、有意思的思路。有些人可能對機器學習存在一些比較庸俗的想法看法。好比說停留在‘機器學習究竟是不是經典意義的人工智能的問題上,貶低一些如今在機器學習、深度學習領域的工做,認爲這些不是真正的人工智能,哲學或物理意義上不深入。還有一種觀點認定機器學習,甚至只是深度學習已經能夠解決一切的問題,只不過是缺少一步一步去實現。這兩種觀點都不夠成熟客觀。咱們須要更冷靜一些,平臺是對的、大方向是對的,可是仍是有不少空白鬚要去填補、不少突破尚未實現。不要急着去摘一些果子,或者閃開就算過了,其實能夠扎進去作一些有深度、有份量的東西。」
問:做爲華人,在美國作科研,會有民族的包袱嗎?
Eric:「我我的在文化上是很是東西兼容的,對東西方文化都有認真學習和較普遍的瞭解和心得。在文化層面,我可能較不少國內朋友更接近中國傳統知識份子——對中國傳統文化很是瞭解和欣賞,愛古文,詩詞,歷史;欣賞秦漢,魏晉之風。但說到學術研究,我不但願它被包裝成民族之間的比賽。作科研,不能作成比賽,而是一種對未知和完美的自我追求。當成比賽本質上是功利性的,是作不出來一流成果的,更須要對問題有一種本質性的好奇,但願去理解、解決這個問題。比別人快、擊敗別人只是副產品。我老跟個人學生說一個例子,寫論文與作研究就像花樣滑冰、體操比賽同樣,若是老想着個人動做能得10分、滿分、對手怎麼樣,你的動做確定走形、作很差。若是你想着——我要在舞臺上享受表演,你確定會作得很好。」
問:在您的研究領域中,數學重要嗎?扮演着怎樣的角色?
Eric:「重要!數學從方法論上提供解決方法,從思惟上來說它能夠培養一種嚴謹的態度,從而爲問題尋找一個比較嚴格的、普適的、甚至更好的解決方法。可是我不太建議單獨強調數學或物理某一個學科知識的做用。就像在戰場上,我身邊有武器,什麼合適我就抓起來用,而不是說我必定要從始到終用某一種武器。在研究的時候,我須要尋求一個經得起考驗的解決方案,它是從數學來、從工程來、從物理來都不重要。只是,當你在尋求解決方案時,你會發現數學是一個避不開的因素,它天然而然地影響你的選擇。
問:最後,可否給有志於從事計算機科學研究的學生提些您的我的建議?
Eric:其實以前了分享過不少次了,但都是以英文的方式。今天藉着這個機會,但願也能讓更多的中國學生們看到:
1、清楚地認識到什麼是你的目標以及什麼是你在技術能力和心智上的優點和不足,這兩點對於你的成功同等重要。根據這些分析,再來設定本身的目標,規劃本身的行動。
2、當你發覺有必要作出改變時不要猶豫。改變本身的職業方向永遠不嫌太晚,只要這個改變是嚴肅的,且你可以保證在新的方向上盡心盡力。那些浪費在猶豫、等待上的時間常常會比你去適應新生活的時間更長。我曾經處於本身新職業方向的谷底,由於在我更換專業的時候,我對機器學習(machine learning)一無所知。但我知道,我會愛上它,由於這個領域的美與力量。從機器學習方向的入門者到成爲CMU的教授,我花了五年時間。
3、你須要很是努力地工做。在個人研究生和以後的職業生涯中,一週7天,我天天平均工做12小時,並保持着高度集中的注意力和高效率。(固然,我其實並不把我作的這些看作工做,我以爲它們和娛樂活動一樣甚至更爲有趣。)
4、你努力工做的動力不該該來自你的上司給予的壓力,而是由於你受到工做的啓發與觸動,並愛上了工做。我常常告訴個人學生和朋友,個人研究就是個人生活,而不是僅僅把它看作工做。相比於看電視和玩紙牌,我更享受從事研究。
5、與此同時,你仍然能夠擁有一個多彩的、充滿活力的生活。我是體育迷和音樂迷,也喜歡作其餘許多事情,享受和家人、朋友在一塊兒的時光。因此我從不消磨時間。當我不在工做時,我盡情地娛樂或鍛鍊身體(好比去健身房,彈鋼琴……),並花時間和家人、朋友們相處。
6、你須要讓本身變得很是有創造力,很是獨立。實話說,我研究生階段的不少研究點子並不來自於個人導師,而是我本身想出來的。我從Berkeley的導師那裏得到的,更多的是研究上的精神和資金支持、研究方式和研究品味上的啓發、誠實的品質和自豪感,以及他們的友誼。
7、要了解你研究領域中最新的進展。每一年讀一千篇論文並非一件聳人聽聞的事。事實上若是想成爲領域內的頂尖學者,你要了解一切,不只在本領域,還有許多的相關領域。
8、當你作出突破性成果的同時,你也應該尊重領域內權威們的成果。不要認爲他們愚蠢而本身更聰明,而且要去問本身爲何多年之前他們沒有像你這樣作。另外一方面,當你確信你確實得到了權威們沒有的洞見時,你也要有超越他們的勇氣。
9、要變得學識廣博而靈活。許多問題和技術都是相關的,不要在一棵樹上吊死。
10、在研究中作一個完美主義者或理想主義者歷來不是一件壞事。擁有一個樂觀的性格和強健的體魄是很是重要的。不要愚蠢地假設本身由於比別人更聰明,因此能不那麼努力。事實上,大多數我認識的頂尖科學家都是既絕頂聰明,又會長時間工做並保持高效。因此你須要健康的身體來與他們競爭。我本身在大學時代就是一個半專業的運動員。比起那些比我年輕10-20歲以上的學生們,我至今仍能更高強度、更長時間地連續工做和娛樂。
11、學會溝通的藝術。樂意去與同事和競爭者討論、分享你的觀點。不只向同事學習,也要向競爭者學習。
12、最重要的是,請保持誠實、開放、耐心、快樂和富於遠見,而不是變得卑鄙、封閉、急躁、苦澀和短視。
人物簡介
邢波(Eric Xing)博士現任卡耐基梅隆大學計算機科學系教授。他的主要研究興趣集中在機器學習和統計方法論的發展及大規模計算系統和架構,但願可以解決在複雜系統中的高維、多峯和動態的潛在世界中的自動化學習、推理以及決策問題。邢波教授擁有美國羅格斯大學分子生物學博士學位和美國加州大學伯克利分校計算機科學博士學位。
邢波教授目前正在進行的研究工做包括:1. 統計學習基礎,包括針對估測時間或空間變化係數模型的理論和算法,稀疏的結構化輸入/輸出模型和非參數貝葉斯模型的理論和算法;2.在分佈式系統或雲端,搭建基於大模型和大數據規模的並行機器學習的框架;3. 針對基因調節、遺傳變異和疾病相關性的計算和統計分析;4. 將統計學習應用到社交網絡,數據挖掘和計算機視覺中。
邢波教授至今已發表了超過200篇受同行審議的論文。他是美國統計協會雜誌(JASA)、應用統計年鑑(AOAS)、IEEE模式分析與機器智能學報(PAMI)和PLoS計算生物學雜誌(the PLoS Journal of Computational Biology)的副主編,機器學習雜誌(MLJ)和機器學習研究雜誌(JMLR)的執行主編。他是美國國防部高級研究計劃局(DARPA)信息科學與技術顧問組的成員,美國國家科學基金會(NSF)事業獎、Alfred P. Sloan學者獎、美國空軍青年學者獎、 以及IBM開放協做研究學者獎得到者。
____________________________________________________________________________________
相關閱讀
解密優秀博士成長史——微軟亞洲研究院首屆博士生學術論壇Panel討論經驗總結
歡迎關注
微軟亞洲研究院人人網主頁:http://page.renren.com/600674137
微軟亞洲研究院微博:http://t.sina.com.cn/msra
from: http://blog.sina.com.cn/s/blog_4caedc7a0102uwvu.html