七步教你Python進行機器學習

時間 2019-11-05

標籤 python 進行機器學習欄目 Python 简体版

原文原文鏈接

網絡上有不少Python學習資源和機器學習學習資源，對於一個新手而言，如何開始呢？本篇文章將教你七步學會使用Python進行機器學習。算法

萬事開頭難。面對紛繁萬千的網絡學習資源，不知如何下手，而每每第一步就開始眼花繚亂，不知所措。下面咱們將從一個新手的角度來指引你如何更好地選擇免費的網絡資源學習，以及採用何種學習順序來掌握它。編程

首先我假設，你在如下幾個方面都是初學者：數組

——機器學習網絡

——Python 框架

——任何Python的機器學習庫/科學計算庫/數據分析庫 dom

若是你瞭解前面兩個方面多是頗有幫助的，不過若是你對它們都一無所知的話，下面的前幾個步驟是能夠幫到你的。機器學習

1 Python基礎工具

若是咱們想要使用Python進行機器學習的話，掌握Python的基礎知識是必不可少的。幸運的是，做爲一個通用的流傳度較廣的語言，Python的教程是很容易找到的，你只是須要尋找一個比較好的學習起點。學習

首先，你須要安裝Python。由於咱們須要使用科學計算庫和機器學習庫，因此我建議你安裝Anaconda，它是一個實現Python的強大的工業產品，適用於Linux/OSX/Windows，徹底包含機器學習庫/科學計算庫，包括numpy/scikit-learn/matplotlib，同時它也包括iPython Notebook（一個Python教程的交互界面）。同時我建議使用Python2.7版本，由於這是一個當下用戶安裝的主流版本。測試

若是你沒有任何編程基礎知識，建議你從如下書籍學起，它們都是能夠從互聯網上免費下載的：

▪ Python The Hard Way by Zed A. Shaw

若是你具備必定的編程基礎，只是對Python不熟悉，那麼你能夠採起如下的教程：

▪ Google Developers Python Course (highly recommended for visual learners)

▪ An Introduction to Python for Scientific Computing (from UCSB Engineering)by M. Scott Shell (a great scientific Python intro ~60 pages)

▪ Learn X in Y Minutes (X = Python)

若是你十分熟悉Python的話，你徹底能夠跳過第一步，固然我建議你仍是多閱讀Python Documentation.

2 機器學習基礎

數據科學家一般有不少種定義，許多人學習機器學習算法去分類。首先，頗有必須去學習一下Kernel methods，難道是爲了更加深入地理解如何構建一個support vector model嗎？固然不是，就像生活中的大部分事務同樣，每個深厚的理論必定對應着實際的應用。

若是你時間較充足的話，須要去學習一下斯坦福大學的 Andrew Ng's Machine Learning course以及這個課程的非官方筆記（一些學生總結的）。你不須要掌握課程視頻中每一個細節，你只須要學會如何去運用便可。好比當你遇到一個迴歸分析的問題時候，你能夠回過頭來看Ng的迴歸分析那一部分的講解。

3 Python科學計算庫

當咱們進行機器學習時，一些Python的科學計算庫是常常須要用到的，以下所列：

▪ numpy - 處理N維數組時頗有用
▪ pandas - 數據分析庫
▪ matplotlib - 高質量作圖
▪ scikit-learn - 機器學習算法庫

一個好的學習以上知識的資源是：

▪ Scipy Lecture Notes by Gaël Varoquaux, Emmanuelle Gouillart, and Olav Vahtras

以及

▪ 10 Minutes to Pandas

從以上教程中，你將會學習到那些科學計算庫的使用。

4 開始動手使用Python進行機器學習

咱們首先從scikit-learn庫開始學習機器學習算法。

如下一些教程或練習都是能夠在iPython Notebook中練習，它是一個交互式的能夠編譯運行Python的環境。

下面將提供一些免費的scikit-learn學習資源：

一個對scikit-learn的簡單介紹，包括大部分機器學習算法:

▪ An Introduction to scikit-learn by Jake VanderPlas

一個更加深刻一點的介紹，包括從頭至尾用一個著名的數據集來作一個項目:

▪ Example Machine Learning Notebook by Randal Olson

聚焦在評估scikit-learn中不一樣模型，包括訓練和測試數據集:

▪ Model Evaluation by Kevin Markham