機器學習入坑指南(七):機器學習的知識結構

互聯網的浪潮席捲全球,它功成名遂,高處不勝寒,一覽衆山小。然而時代的弄潮兒不會止步於此,他們還要站在新的浪潮之巔,去征服更大的世界。html

1、前言:爲什麼要學習機器學習

我不知道下一個風口究竟是什麼,但我相信人工智能、虛擬現實、區塊鏈,至少有一種將重塑咱們的將來。git

通過數十年的發展,機器學習被認爲是人工智能中最成熟、應用最普遍、成果最使人振奮的一環。人們對人工智能的遐想一般是擁有獨立思惟的人型機器,這從各個層面上來看都任重而道遠。但機器學習帶來的好處已經十分實在——語音/圖像識別、人臉識別、智能推送(雖然很煩),以及日趨成熟的自動駕駛。github

也許你們對鋪天蓋地的人工智能培訓廣告感到厭倦,對廣告上誘人的高價薪酬半信半疑,但只要你用心學習一段機器學習,你就會發現它的魅力所在。互聯網時代積累下來浩瀚的原始數據,咱們須要一種強有力的工具去挖掘它們的價值,這種工具,或許正是打開新世界大門的鑰匙。每個技術人都不但願本身被淘汰,也許機器學習的知識不能幫你找到工做,但倒是一張入場券。算法

據我所知,目前 AI 行業的門檻仍然較高,短時間甚至有供過於求的狀況。但互聯網行業的發展也一樣經歷過這個時期。等到它真正爆發的時候再去入坑,其實已經晚了。二十年前一個學歷普通的年輕人決定進入 IT 行業,只須要稍微培訓一下甚至是自學一段時間就能進大廠,並且可能已經成爲了行業大牛,但在今天想複製一樣的成功卻十分困難。爲何股市裏那麼多韭菜?牛市一窩蜂進去,熊市一窩蜂出來,止跌不止盈,高買低賣。也許道理咱們都懂,但這是人性的弱點,我體會過,很難克服,因此,成功的永遠只是少數人。編程

若是你只是爲了找工做,想花費一兩個月時間(甚至還堅持不了)去學機器學習,那仍是放棄吧。若是我是公司老闆,這個行業我不會冒險,直接從高學歷應屆畢業生裏找人成本纔是最低的。機器學習

若是你想真正掌握這門技術,Welcome to Westworld!工具

2、知識結構分析

下圖是根據《機器學習實戰》一書製做的思惟導圖,咱們能夠利用它來分析一下機器學習的知識結構。學習

圖中,用紅色星星標註的是前期須要重點學習的內容,也是比較通用的部分。綠色的餅狀圖表明我對特色知識的理解程度。區塊鏈

我想,這個結構比咱們接觸過的大部分學科都要簡單。因此沒有必要由於高大上的名字就產生畏難情緒。甚至能夠再進一步將其簡化爲「迴歸」「分類」兩大部分。也許未來還會有「極簡機器學習手冊」之類的書籍誕生吧,誰知道呢。人工智能

書中按順時針順序組織章節內容,我以爲是 OK 的。

1 機器學習基礎部分

機器學習須要什麼先導知識呢?

本科正常畢業水平的線性代數機率論,和一點點計算機知識便可。

忘了的知識能夠複習,真遇到不懂的上網查查就行了。至於編程,因爲有 Python 這樣的語言在,只須要花費不多的時間(一週之內),就能從 0 開始讀懂程序。若是你有任何一門語言的基礎,那麼根本不用單獨花時間學 Python,遇到看不懂的語法直接搜索就完了。

2 分類

分類分爲監督分類和非監督分類,又各自有不一樣的方法。

監督分類,如圖所示,大體就是 KNN、決策樹、貝葉斯、邏輯迴歸、SVM,其中 SVM 相對複雜點,其它的很容易理解。

非監督分類,主要就是聚類和密度估計。

3 迴歸

迴歸即定量的分析或預測。包括線性迴歸(簡單線性迴歸和多元線性迴歸)和樹迴歸。這部分的模型也很好理解。

關於迴歸和分類的區別,舉個例子:

預測明天下不下雨,屬於分類問題;
預測明天的降雨量,屬於迴歸問題。

4 研究方向

其一,是尋找新的分類與迴歸問題的算法。

其二,是如何改進已有的算法,提升他們的準確度與運算效率。

其三,是研究如何把機器學習與實際應用更好地結合。

對於不打算走算法路線的同窗們,只要不斷跟進新的成果,並嘗試去應用它們就足夠了,把機器學習當作一個強有力的工具便可。

3、學習路徑與資料分享

1 學習路徑

其實剛纔的結構分析中已經體現出來了。個人學習路徑是這樣的:

機器學習是什麼 -> 線性迴歸 -> 邏輯迴歸 -> SVM -> 線代 -> KNN -> 貝葉斯 -> 決策樹 ...

各個算法的學習順序無所謂,一個一個攻克便可。先把基礎的學下來,並動手寫代碼實踐,再嘗試去改進它。

數學基礎不用擔憂!!!

編程不用擔憂!!!

找不到對象徹底不用擔憂!!!

2 學習資料

最後給你們推薦一些學習資料。

[1] GitHub - Avik-Jain/100-Days-Of-ML-Code,一個小哥分享的學習筆記與實踐代碼,時間比較充裕的學生黨能夠按照他每日的進度學習。

[2] 網盤 - 一些參考書籍與視頻教程,提取密碼:dnxs。是大佬分享給個人,內容不少,你們各取所需。

[3] MIT 的線代教程 ,公認的好課。須要補線代知識的同窗能夠刷一遍。

[4] 斯坦福的機器學習教程,吳恩達老師是咱們共同的老師。

[5] 一些培訓機構的在線課程,比較適合沒有大把時間學習的上班族,有人替你規劃學習路線、督促你學習,目前來看價格仍是不便宜的,你們本身作取捨吧。

[6] 「CSDN - Evan 的博客」,一個和你一塊兒成長進步的熱愛學習的新時代優秀青年,最大的優勢是爲人謙虛,低調。並無太多才華,就是長得比較帥。關注我,讓你體驗超越個人感受,重拾學習的自信與快樂。

聲明

上述資源來自互聯網,若有侵犯版權請聯繫我,我會在第一時間處理。

資料僅做爲我的學習使用,切勿用在商業用途,請於下載後24小時以內刪除,不然由此引起的法律糾紛及連帶責任本人概不承擔。

聲明

上述資源來自互聯網,若有侵犯版權請聯繫我,我會在第一時間處理。

資料僅做爲我的學習使用,切勿用在商業用途,請於下載後24小時以內刪除,不然由此引起的法律糾紛及連帶責任本人概不承擔。

歡迎關注 Evan 的博客

相關文章
相關標籤/搜索