圖文並茂,700 頁的機器學習筆記火了!值得學習

最近在學習機器學習,看到了這份筆記,介紹的很是詳細,記錄一下做爲學習。

圖片

做者

梁勁(Jim Liang),來自 SAP (全球第一大商業軟件公司)。算法

書籍特色

條理清晰,含圖像化表示更加易懂,對公式有詳細的註解等。網絡

內容概要

主要分爲基本概念、經常使用算法和其餘三部分。
圖片架構

爲何會這樣?機器學習

  • 首當其衝就是數學,涉及統計學、微積分、機率、線性代數等,你們雖然都學太高等數學,但若是你還記得裏面的細節,算你牛。更可能的狀況是,多數人都對高等數學忘記了,面對各類算法裏的大量公式,感到厭惡,甚至恐懼。
  • 其次由於機器學習自己是一個綜合性學科,並且是一個快速發展的學科,知識點散亂,缺少系統性。
  • 市面上的機器學習/深度學習書籍、文章、教程,遍地開花,但能以清晰的方式表達、按部就班地講解的教程,其實很少,大量的教程沒有考慮到學習者的基礎,使得初學者感到挫敗和困惑。
  • 正是對機器學習的過程當中的痛苦有切身體會,做者Jim Liang但願能作一份教程,以淺顯易懂的方式去講解它,下降你們的學習門檻。爲此花費了數月時間,常常作到深夜,把本身的學習筆記整理成了這份教程。

Part 1 介紹了基本概念,包括:

  • 機器學習的流程
  • 數據處理
  • 建模
  • 評估指標(如 MSE、ROC 曲線)
  • 模型部署
  • 過分擬合
  • 正則化等

在第一部分,做者先介紹了現在應用廣泛的機器學習:從自動駕駛、語音助手到機器人。其中有些思想,也是衆多讀者們瞭解過的,例如:爲什麼機器學習在這個時候會火(大數據、計算力、更好的算法);機器學習、人工智能、深度學習三者的關係等。函數

除了這些基礎概念,這份教程也對機器學習模型的開發流程作了圖像化展現(以下圖),即便對此不太瞭解的讀者,也能經過這種流程展現有所學習。
圖片
圖片學習

機器學習700頁筆記電子版:

公衆號【計算機視覺聯盟】後臺回覆:9001,便可獲取電子版大數據

在Part2,做者介紹了經常使用的算法,包括:

  • 線性迴歸
  • 邏輯迴歸
  • 神經網絡
  • SVM
  • Knn
  • K-Means
  • 決策樹
  • 隨機森林
  • AdaBoost
  • 樸素貝葉斯
  • 梯度降低
  • 主成分分析

這部分包含了大量的數學公式,但做者盡力註解了其中的每一個公式,從而充分、清晰地表達了衆多數學概念。人工智能

例如在「神經網絡」部分,做者整理了 59 頁的筆記(從 311 頁到 369 頁)。做者從人腦中的神經元架構提及,介紹了人工神經網絡(ANN)、人工神經元工做的原理。這份筆記很是注重圖像化的概念解釋,理解起來很是直觀。spa

例如,下圖中的概念解釋很形象地展示了生物神經元和人工神經元工做方式的類似性。blog

過擬合的解釋
生物神經元的樹突輸入-軸突輸出模式和人工神經元的輸入輸出模式對比。

在涉及到數學公式時,做者會在旁邊有詳細的註解,以下圖所示:

圖片
對於並列的可選項(如激活函數、經常使用神經網絡架構等),也會有全面的列表:

對於神經網絡中較爲複雜的概念(如求導、反向傳播),幾張圖就能解釋清楚:

反向傳播算法完整流程。

前向傳播部分的計算細節。

爲了方便你們學習,咱們已經準備好了完整版的機器學習筆記PDF,感興趣的同窗能夠按照下述步驟便捷獲取:

機器學習700頁筆記電子版:

公衆號【計算機視覺聯盟】後臺回覆:9001,便可獲取電子版

相關文章
相關標籤/搜索