機器學習導圖系列(1):數據處理

機器學習導圖系列教程旨在幫助引導開發者對機器學習知識網絡有一個系統的概念,其中具體釋義並未完善,須要開發者本身探索才能對具體知識有深刻的掌握。本項目靈感來自Daniel Formoso的github開源項目。本文做者對其項目進行翻譯、整理、批註等二次創做,其中不乏生僻的數學名詞,對於沒有留過學的做者來講費了不少功夫。我又將導圖整理成了知識卡片,方便你們查看。因爲機器學習的知識網絡很大,致使完整的導圖過大,文章中的圖片可能通過壓縮,如需完整圖片可查看github項目machine-learning-mindmap-cn下載高清原圖。本系列還在持續創做中,你的點贊、留言、star都會成爲我持續創做的動力。git

Daniel Formoso: https://github.com/dformoso/machine-learning-mindmap
machine-learning-mindmap-cn: https://github.com/caiyongji/machine-learning-mindmap-cngithub

機器學習導圖系列分爲五大模塊。算法

  1. 機器學習數據處理
  2. 機器學習概念
  3. 機器學習過程
  4. 機器學習算法
  5. 機器學習模型及神經網絡模型

數據類型

數據探索

數據清洗

特徵插補

特徵工程

特徵選擇

特徵編碼

特徵歸一化(Normalisation)或縮放(Scaling)

構造數據集

最後

你隨手就是一個贊。網絡

相關文章
相關標籤/搜索