scikit-learn 和pandas 基於windows單機機器學習環境的搭建

劉建平Pinard

十年碼農,對數學統計學,數據挖掘,機器學習,大數據平臺,大數據平臺應用開發,大數據可視化感興趣。

scikit-learn 和pandas 基於windows單機機器學習環境的搭建

 

    不少朋友想學習機器學習,卻苦於環境的搭建,這裏給出windows上scikit-learn研究開發環境的搭建步驟。php

Step 1. Python的安裝

    python有2.x和3.x的版本之分,可是不少好的機器學習python庫都不支持3.x,所以,推薦安裝2.7版本的python。當前最新的python是2.7.12.連接以下:css

    https://www.python.org/downloads/release/python-2712/html

    裏面能夠看到有32位版和64位版的。若是你的機器是64位版的,那麼32位和64位版的任選一個安裝就能夠了。若是機器是32位版的,就只能安裝32位版的了。若是你搞不清楚你的機器的位數,那麼就安裝32位版的吧。也就是「Windows x86 MSI installer」。python

Windows x86-64 MSI installer Windows for AMD64/EM64T/x64, not Itanium processors 8fa13925db87638aa472a3e794ca4ee3 19820544 SIG
Windows x86 MSI installer Windows   fe0ef5b8fd02722f32f7284324934f9d 18907136 SIG

     安裝完畢後,能夠設置下環境變量,把python目錄加到PATH,好比個人Python裝在 C:\Python27,那我就把C:\Python27\Scripts和C:\Python27加到環境變量。固然不加也能夠。這樣每次使用Python時加上python的全路徑名。git

    安裝完成後,在windows的命令行輸入python,若是能出來python的基本信息說明安裝成功。程序員

Step 2. Python包管理工具pip的安裝

    咱們須要包管理工具來方便python庫的安裝,包管理工具備不少,這裏推薦我習慣使用的pip。github

    下載pip的安裝腳本。連接以下。下載get-pip.py。而後到你的下載目錄,在命令行輸入"python get-pip.py",跑完便可安裝成功。算法

    https://pip.pypa.io/en/stable/installing/json

    下載完畢後,記得跑下這個命令「pip install -U pip」,一是看看pip能不能正常工做,二是把pip升級到最新版本。小程序

Step 3. 安裝 Visual C++ Compiler for Python

    連接在這: https://www.microsoft.com/en-us/download/details.aspx?id=44266

    這個不裝後面不少科學計算的都會裝不了。

Step 4. 安裝numpy和scipy

    這兩哥們是科學計算和矩陣運算必備工具。

    因爲numpy和scipy直接用pip安裝常常會出各類各樣的問題,所以通常推薦下載離線版的whl來安裝numpy和scipy。

    首先安裝離線版的numpy,這裏我通常是在下面的連接下載numpy,固然scipy也是在這。

    http://www.lfd.uci.edu/~gohlke/pythonlibs/#numpy

    能夠看到裏面有不少版本的numpy能夠下載,咱們的python是2.7,windows 32位的,所以下載「numpy-1.11.2+mkl-cp27-cp27m-win32.whl

    下載完畢後進入下載目錄,在命令行運行 "pip install numpy-1.11.2+mkl-cp27-cp27m-win32.whl" ,這樣numpy就安裝成功了。

    用一樣的方法安裝scipy。在下面的連接下載scipy。

    http://www.lfd.uci.edu/~gohlke/pythonlibs/#scipy

    咱們的python是2.7,windows 32位的,所以選擇scipy-0.18.1-cp27-cp27m-win32.whl下載。

    完了運行 "pip install scipy-0.18.1-cp27-cp27m-win32.whl"

    這樣numpy和scipy兩個好基友就搞定了。

Step 4. 安裝matplotlib,pandas和scikit-learn

    這沒有什麼好說的,直接在命令行運行下面的命令便可。注意,先安裝matplotlib再安裝pandas

    pip install -U matplotlib

     

    pip install -U jinja2

    pip install -U jsonschema

    pip install -U pyzmq

    pip install -U pandas

 

    pip install -scikit-learn

Step 5. 安裝ipython和ipython notebook

    ipython notebook是最經常使用的python交互式學習工具,固然,如今叫作Jupyter Notebook。scikit-learn官方的例子都給出了用ipython notebook運行的版本。

    安裝方式很簡單:

    pip install ipython

    pip install jupyter

    官網在這:http://ipython.org/notebook.html

    安裝完畢後,在命令行輸入「jupyter-notebook」,輸出會提示你notebook運行在http://localhost:8888

Step 6.  Hello World!嘗試運行一個scikit-learn機器學習程序

 

    在scikit-learn官網下載一個機器學習的例子,好比: http://scikit-learn.org/stable/_downloads/plot_cv_predict.ipynb

    而後在下載目錄運行"jupyter notebook",接着瀏覽器打開http://localhost:8888

    能夠在瀏覽器看到你下載目錄的內容,咱們打開剛下載的plot_cv_predict.ipynb這個文件連接,能夠看到python程序的內容,這時咱們能夠點上面的三角形按鈕,一步步的運行程序,若是沒有報錯,最後能夠看到一個線性迴歸的預測圖。

    能夠修改這個程序,從新一步步的跑,達到研究學習的目的。

    以上就是scikit-learn和pandas環境的搭建過程。但願你們均可以搭建成功,來研究機器學習。

 

(歡迎轉載,轉載請註明出處。歡迎溝通交流: pinard.liu@ericsson.com) 

 

 

    

 
分類:  0081. 機器學習
標籤:  scikit-learn
好文要頂  已關注  收藏該文   
0
0
 
 
 
« 上一篇: 機器學習研究與開發平臺的選擇
» 下一篇: 用scikit-learn和pandas學習線性迴歸
posted @  2016-10-30 17:37 劉建平Pinard 閱讀(1448) 評論(0) 編輯 收藏
 
 
 
相關文章
相關標籤/搜索