普通程序員如何轉向AI方向

時間 2019-11-10

原文原文鏈接

摘要：　AI，也就是人工智能，並不只僅包括機器學習。曾經，符號與邏輯被認爲是人工智能實現的關鍵，而現在則是基於統計的機器學習佔據了主導地位。最近火熱的深度學習正是機器學習中的一個子項。目前能夠說，學習AI主要的是學習機器學習。html

　　眼下，人工智能已經成爲愈來愈火的一個方向。普通程序員，如何轉向人工智能方向，是知乎上的一個問題。本文是我對此問題的一個回答的歸檔版。相比原回答有所內容增長。程序員

一. 目的
　　本文的目的是給出一個簡單的，平滑的，易於實現的學習方法，幫助「普通」程序員踏入AI領域這個門。這裏，我對普通程序員的定義是：擁有大學本科知識；平時工做較忙；本身能獲取的數據有限。所以，本文更像是一篇「from the scratch」的AI入門教程。算法

二. AI領域簡介
　　AI，也就是人工智能，並不只僅包括機器學習。曾經，符號與邏輯被認爲是人工智能實現的關鍵，而現在則是基於統計的機器學習佔據了主導地位。最近火熱的深度學習正是機器學習中的一個子項。目前能夠說，學習AI主要的是學習機器學習。可是，人工智能並不等同於機器學習，這點在進入這個領域時必定要認識清楚。關於AI領域的發展歷史介紹推薦看周老師寫的《機器學習簡介》。下面一個問題是：AI的門好跨麼？其實很很差跨。咱們以機器學習爲例。在學習過程當中，你會面對大量複雜的公式，在實際項目中會面對數據的缺少，以及艱辛的調參等。若是僅僅是由於以爲這個方向將來會「火」的話，那麼這些困難會容易讓人放棄。考慮到普通程序員的特色，而要學習如此困難的學科，是否就是沒有門路的？答案是否認的。只要制定合適的學習方法便可。網絡

三. 學習方法app

　　學習方法的設定簡單說就是回答如下幾個問題：我要學的是什麼？我怎樣學習？我如何去學習？這三個問題歸納說就是：學習目標，學習方針與學習計劃。學習目標比較清楚，就是踏入AI領域這個門。這個目標不大，所以實現起來也較爲容易。「過大的目標時就是爲了你往後放棄它時找到了足夠的理由」。學習方針能夠總結爲「興趣爲先，踐學結合」。簡單說就是先培養興趣，而後學習中把實踐穿插進來，螺旋式提升。這種方式學習效果好，並且不容易讓人放棄。有了學習方針之後，就能夠制定學習計劃，也稱爲學習路線。下面就是學習路線的介紹。機器學習

四. 學習路線工具

　　我推薦的學習路線是這樣的，以下圖：
學習

圖1 AI領域學習路線圖優化

　　這個學習路線是這樣設計的：首先了解這個領域，創建起全面的視野，培養起充足的興趣，而後開始學習機器學習的基礎，這裏選擇一門由淺入深的課程來學習，課程最好有足夠的實驗可以進行實戰。基礎打下後，對機器學習已經有了充足的瞭解，能夠用機器學習來解決一個實際的問題。這時仍是能夠把機器學習方法看成一個黑盒子來處理的。實戰經驗積累之後，能夠考慮繼續進行學習。這時候有兩個選擇，深度學習或者繼續機器學習。深度學習是目前最火熱的機器學習方向，其中一些方法已經跟傳統的機器學習不太同樣，所以能夠單獨學習。除了深度學習之外，機器學習還包括統計學習，集成學習等實用方法。若是條件足夠，能夠同時學習二者，一些規律對二者是共通的。學習完後，你已經具有了較強的知識儲備，能夠進入較難的實戰。這時候有兩個選擇，工業界的能夠選擇看開源項目，以改代碼爲目的來讀代碼；學術界的能夠看特定領域的論文，爲解決問題而想發論文。不管哪者，都須要知識過硬，以及較強的編碼能力，所以很能考察和鍛鍊水平。通過這個階段之後，能夠說是踏入AI領域的門了。「師傅領進門，修行在我的」。以後的路就要本身走了。編碼

　　下面是關於每一個階段的具體介紹：

　　0.領域瞭解　

　　在學習任何一門知識以前，首先第一步就是了解這個知識是什麼？它能作什麼事？它的價值在什麼地方？若是不理解這些的話，那麼學習自己就是一個沒有方向的舟，不知道駛向何處，也極易有沉船的風險。瞭解這些問題後，你才能培養出興趣，興趣是最好的引路人，學習的動力與持久力才能讓你應付接下來的若干個階段。關於機器學習是什麼，能作什麼，它與深度學習以及人工智能的關係，能夠看我寫的博客從機器學習談起：

　　1.知識準備　

　　若是你離校太久，或者以爲基礎不牢，最好事先作一下準備複習工做。「工欲善其事，必先利其器」。如下的準備工做很少，但足以應付後面階段的學習。

數學：複習如下基本知識。線性代數：矩陣乘法；高數：求導；機率論：條件與後驗機率。其餘的一些知識能夠在後面的學習的過程當中按需再補；
英文：常備一個在線英文詞典，例如愛詞霸，可以不吃力的看一些英文的資料網頁；
FQ：能夠隨時隨地上Google，這是一個很重要的工具。不是說百度查的不能看，而是不少狀況下Google搜出來的資料比百度搜的幾十頁的資料還管用，尤爲是在查英文關鍵字時。節省時間但是很重要的學習效率提高；

　　2.機器學習　

　　機器學習的第一門課程首推Andrew Ng的機器學習。這門課程有如下特色：難度適中，同時有足夠的實戰例子，很是適合第一次學習的人。cs229 這門課程我這裏不推薦，爲何，緣由有如下：

時間：cs229 的時間太早，一些知識已經跟不上當今的發展，目前最爲火熱的神經網絡一筆帶過。而Cousera上神經網絡但是用了兩個課時去講的！並且很是詳細；
教學：Ng在cs229 時候的教學稍顯青澀，多是面對網絡教學的緣由。有不少問題其實他都沒有講清楚，並且下面的人的提問其實也很煩躁，你每每不關心那些人的問題。這點在Coursera上就明顯獲得了改善，你會發現Ng的教學水平大幅度改善了，他會對你循循善誘，推心置腹，由淺入深的教學，在碰到你不明白的單詞術語時也會叫你不要擔憂，更重要的，推導與圖表不要太完善，很是細緻清晰，這點真是強力推薦；
字幕：cs229 的字幕質量比Coursera上的差了一截。Coursera上中文字幕翻譯通過了多人把關，質量頗有保證；
做業：cs229 沒有做業，雖然你能夠作一些，但不會有人看。這點遠不如Coursera上每週有deadline的那種做業，並且每期做業提交上去都有打分。更重要的是，每期做業都有實際的例子，讓你手把手練習，並且能看到本身的成果，成就感滿滿！

　　3.實踐作項目　

　　學習完了基礎課程，你對機器學習就有了初步瞭解。如今使用它們是沒有問題的，你能夠把機器學習算法看成黑盒子，放進去數據，就會有結果。在實戰中你更須要去關心如何獲取數據，以及怎麼調參等。若是有時間，本身動手作一個簡單的實踐項目是最好的。這裏須要選擇一個應用方向，是圖像（計算機視覺），音頻（語音識別），仍是文本（天然語言處理）。這裏推薦選擇圖像領域，這裏面的開源項目較多，入門也較簡單，可使用OpenCV作開發，裏面已經實現好了神經網絡，SVM等機器學習算法。項目作好後，能夠開源到到 Github 上面，而後不斷完善它。實戰項目作完後，你能夠繼續進一步深刻學習，這時候有兩個選擇，深度學習和繼續機器學習；

　　4.深度學習

　　深度學習：深度學習是目前最火熱的研究方向。有如下特色：知識更新快，較爲零碎，沒有系統講解的書。所以學習的資源也相對零散，下面是一些資源介紹。其中不推薦的部分並不表明很差，而是在這個初學階段不合適：

推薦，UFLDL： 很是好的DL基礎教程，也是Andrew Ng寫的。有很詳盡的推導，有翻譯，且翻譯質量很高；
推薦，Deep learning (paper)：2015年Nature上的論文，由三位深度學習界的大牛所寫，讀徹底篇論文，給人高屋建瓴，一覽衆山小的感受，強烈推薦。若是隻能讀一篇論文了解深度學習，我推薦此篇。這篇論文有同名的中文翻譯； 推薦，Neural networks and deep learning：這本書的做者很是擅長以淺顯的語言表達深入的道理，雖然沒有翻譯，可是閱讀並不困難； 推薦，Recurrent Neural Networks： 結合一個實際案例告訴你RNN是什麼，整篇教程學完之後，會讓你對RNN如何產生做用的有很清晰的認識，而這個效果，甚至是讀幾篇相關論文所沒有的； 不推薦，Neural Networks for Machine Learning - University of Toronto | Coursera：深度學習創始人教的課，最大的問題是太難，並且老先生的吐字有時不是很標準； 不推薦，Deep Learning (book)：一樣也是由深度學習大牛所寫的書，但感受就像是第二做者，也就是他的學生所寫的。不少內容都講了，可是感受也沒講出什麼內容來，只是告訴你來自那篇論文，這樣的話可能直接閱讀論文更合適。 不推薦，cs231n：李菲菲的課程，頗有名，專門講CNN。可是這門課程有一個最大的問題，就是沒有字幕，雖然有youtube的自動翻譯字幕，但有還不如沒有。

　　5.繼續機器學習　

　　深度學習未必就是將來的必定主流，至少一些大牛是這麼認爲的。傳統的機器學習有以下特色，知識系統化，有相對經典的書。其中統計學習（表明SVM）與集成學習（表明adaboost）是在實踐中使用很是多的技術。下面是相關資源：

推薦，機器學習(周志華)：若是是在之前，機器學習方面的經典教材首推PRML，但如今周老師的書出來之後，就再也不是這樣了。首先推薦讀周老師的書。這本書有一個特色，那就是再難的道理也能用淺顯精煉的語言表達出來。正如周老師的名言：「體現你水平的地方是把難的東西講容易了，而不是把容易的東西講難，想把一個東西講難實在太簡單」；
不推薦，Pattern Recognition And Machine Learning：當前階段不推薦。PRML是以貝葉斯的觀點看待不少機器學習方法，這也是它的一大特點。但對於初學者來講，這種觀點其實並沒有必要。並且此書沒有中文翻譯，當前階段硬啃很容易放棄；

　　6.開源項目　

　　當知識儲備較爲充足時，學習能夠再次轉入實踐階段。這時候的實踐仍然能夠分兩步走，學習經典的開源項目或者發表高質量的論文。開源項目的學習應該以儘可能以優化爲目的，單純爲讀代碼而學習效果每每不太好。好的開源項目均可以在Github 裏搜索。這裏以深度學習爲例。深度學習的開源優秀庫有不少，例如torch，theano等等，這裏列舉其中的兩個：

推薦，DeepLearnToolbox：較早的一個深度學習庫，用matlab語言撰寫，較爲適合從剛學習的課程轉入學習。遺憾的是做者再也不維護它了；
推薦，tensorflow：Google的開源庫，時至今日，已經有40000多個star，很是驚人，支持移動設備；

　　7.會議論文　

　　較好的課程都會推薦你一些論文。一些著名的技術與方法每每誕生於一些重要的會議。所以，看往年的會議論文是深刻學習的方法。在這時，一些論文中的內容會驅使你學習數學中你不擅長的部分。有時候你會以爲數學知識儲備不夠，所以每每須要學習一些輔助課程。當你看完足夠的論文之後，在這個階段，若是是在校學生，能夠選擇某個課題，以發論文爲目的來學習研究。通常來講，論文是工做的產物。有時候一篇基於實驗的論文每每須要你寫代碼或者基於開源項目。所以開源項目的學習與會議論文的工做二者之間是有相關的。二者能夠同時進行學習。關於在哪裏看論文，能夠看一下CCF推薦排名，瞭解一下這個領域裏有哪些優秀的會議。下面介紹兩個圖像與機器學習領域的著名頂級會議：

CVPR：與另兩個會議ICCV和ECCV合稱計算機視覺領域的三大會，注意會議每一年的主頁是變更的，所以搜索須要加上年份；
Conference on Neural Information Processing Systems：簡稱NIPS，許多重要的工做發表在這上面，例如關於CNN的一篇重要論文就是發表在上面；

　　8.自由學習　

　　自由學習：到這裏了，能夠說是進入這個門了。下面能夠依據興趣來自由學習。前階段不推薦的學習資源也可隨意學習，下面是點評：

cs229 ：Ng寫的講義很不錯，其中關於SVM的推導部分很清晰，想學習SVM推薦；
Neural Networks for Machine Learning：大牛的視角跟人就是不同，看看Hinton對神經網絡是怎麼看的，每每會讓你有種原來如此的感悟。其實看這門課程也等同於讀論文，由於幾乎每節課的參考資料裏都有論文要你讀； CS231n: Convolutional Neural Networks for Visual Recognition：最新的知識，還有詳細的做業。國內應該有團隊對字幕進行了翻譯，能夠找找； PRML：做爲一門經典的機器學習書籍，是頗有閱讀必要的，會讓你對機器學習擁有一個其餘的觀察視角；

五. 總結

　　本文的目的是幫助對AI領域瞭解不深，但又想進入的同窗踏入這個門。這裏只說踏入，是由於這個領域的專精實在很是困難，須要數年的積累與努力。在進行領域學習前，充分認識本身的特色，制定合適的學習方法是十分重要的。首先得對這個領域進行充分了解，培養興趣。在學習時，保持着按部就班的學習方針，不要猛進的學習過難資源；結合着學習與實踐相輔的策略，不要只讀只看，實際動手纔有成就感。學習某個資源時要有充分的目的，不是爲了學開源項目而看代碼，而是爲了寫開源項目而看；不是爲了發論文而寫論文，而是爲了作事情而寫論文。若是一個學習資源對你過難，並不表明必定是你的問題，多是學習資源的演講或撰寫人的問題。能把難的問題講簡單的人才是真正有水平的人。因此，必定要學習優質資源，而不是不分青紅皁白的學習。最後，牢記以興趣來學習。學習的時間很長，過程也很艱難，而只有興趣纔是讓你鍥而不捨，攻克難關的最佳助力。

轉載於http://www.cnblogs.com/subconscious/p/6240151.html

若是您發現本社區中有涉嫌抄襲的內容，歡迎發送郵件至：yqgroup@service.aliyun.com 進行舉報，並提供相關證據，一經查實，本社區將馬上刪除涉嫌侵權內容。

原文連接