Sklearn(全稱 SciKit-Learn),是基於 Python 語言的機器學習工具包。html
Sklearn 主要用Python編寫,創建在 Numpy、Scipy、Pandas 和 Matplotlib 的基礎上,也用 Cython編寫了一些核心算法來提升性能。python
Sklearn 包括六大功能模塊:git
分類(Classification):識別樣本屬於哪一個類別,經常使用算法有 SVM(支持向量機)、nearest neighbors(最近鄰)、random forest(隨機森林)算法
迴歸(Regression):預測與對象相關聯的連續值屬性,經常使用算法有 SVR(支持向量機)、 ridge regression(嶺迴歸)、Lasso網絡
聚類(Clustering):對樣本進行無監督的自動分類,經常使用算法有 k-Means(k均值)、spectral clustering(特徵聚類)、mean-shift(均值漂移)dom
數據降維(Dimensionality reduction):減小相關變量維數,經常使用算法有 PCA(主成分分析)、feature selection(特徵選擇)、non-negative matrix factorization(非負矩陣分解)機器學習
模型選擇(Model Selection):比較,驗證,選擇參數和模型,經常使用模塊有 grid search(網格搜索)、cross validation(交叉驗證)、 metrics(度量)函數
數據處理 (Preprocessing):特徵提取和歸一化,經常使用模塊有 preprocessing(預處理),feature extraction(特徵提取)工具
這六個功能模塊涉及 4類算法,分類、迴歸 屬於監督學習,聚類屬於非監督學習。性能
歡迎關注 Youcans 原創系列,每週更新數模筆記
Python數模筆記-PuLP庫
Python數模筆記-StatsModels統計迴歸
Python數模筆記-Sklearn
Python數模筆記-NetworkX
Python數模筆記-模擬退火算法
官網地址:https://scikit-learn.org/
官方文檔中文版: https://www.scikitlearn.com.cn/
內置數據集:https://scikit-learn.org/stable/datasets.html
Sklearn 的安裝要求:Python 3.5 以上版本,須要安裝 NumPy、SciPy、Pandas 工具包的支持,部份內容須要使用 Matplotlib、joblib 工具包。
pip 安裝命令:
pip3 install -U scikit-learn
pip3 install -U scikit-learn -i https://pypi.douban.com/simple
注意 Sklearn 建議安裝 Numpy+mkl,能夠在網址http://www.lfd.uci.edu/~gohlke/pythonlibs/ 找到你須要的numpy+mkl版本,下載後 pip3安裝:
pip install numpy-1.11.1+mkl-cp27-cp27m-win_amd64.whl
Sklearn 內置了一些標準數據集能夠用於練習和測試,都是常常被引用的經典問題,數據網址:https://scikit-learn.org/stable/datasets.html
Sklearn 標準數據集主要包括:
粗略看看 Sklearn 的文檔,是一個功能強大和豐富的機器學習庫,遠遠超出了數學建模學習的範圍。
基於數模教學的目的,本系列主要對應數模學習中的分類、聚類、降維問題,並不打算全面講解 Sklearn 的各類算法,而是以典型問題爲例來介紹原理簡單、使用普遍的基本方法,以便新手入門。
版權說明:
YouCans 原創做品
Copyright 2021 YouCans, XUPT
Crated:2021-05-09
歡迎關注 Youcans 原創系列,每週更新數模筆記
Python數模筆記-PuLP庫(1)線性規劃入門
Python數模筆記-PuLP庫(2)線性規劃進階
Python數模筆記-PuLP庫(3)線性規劃實例
Python數模筆記-Scipy庫(1)線性規劃問題
Python數模筆記-StatsModels 統計迴歸(1)簡介
Python數模筆記-StatsModels 統計迴歸(2)線性迴歸
Python數模筆記-StatsModels 統計迴歸(3)模型數據的準備
Python數模筆記-StatsModels 統計迴歸(4)可視化
Python數模筆記-Sklearn (1)介紹
Python數模筆記-Sklearn (2)聚類分析
Python數模筆記-Sklearn (3)主成分分析
Python數模筆記-Sklearn (4)線性迴歸
Python數模筆記-Sklearn (5)支持向量機
Python數模筆記-NetworkX(1)圖的操做
Python數模筆記-NetworkX(2)最短路徑
Python數模筆記-NetworkX(3)條件最短路徑
Python數模筆記-模擬退火算法(1)多變量函數優化
Python數模筆記-模擬退火算法(2)約束條件的處理
Python數模筆記-模擬退火算法(3)整數規劃問題
Python數模筆記-模擬退火算法(4)旅行商問題