好久沒寫過博客了,一重開就給本身挖了這麼一個大坑……html
最近一段時間看了《機器學習實戰》這本書,感受寫得不錯,認真看了看。關於這本書的書評及購買事宜請移步豆瓣、京東、亞馬遜等網站,這裏很少說。不過有一點,感受這本書有個很好的地方是給出了各個算法的Python實現代碼和講解,要求不高的話能夠拿來用了(懶)。在這裏想好好寫寫從這本書中學到的東西,文中的代碼和主要內容也將均來自這本書。git
目錄github
第一部分 分類算法
第1章 機器學習基礎機器學習
第3章 決策樹性能
第4章 基於機率論的分類方法:樸素貝葉斯學習
第5章 Logistic迴歸大數據
第6章 支持向量機網站
第7章 利用Adaboost元算法提升分類性能
第二部分 利用迴歸預測數值型數據
第8章 預測數值型數據:迴歸
第9章 樹迴歸
第三部分 無監督學習
第10章 利用K-均值聚類算法對未標註數據分組
第四部分 其餘工具
第13章 利用PCA來簡化數據
第14章 利用SVD簡化數據
第15章 大數據與MapReduce
本書的主頁:https://www.manning.com/books/machine-learning-in-action
書中的代碼和所使用的數據集能夠在主頁或者這裏(做者的GitHub版本庫)找到。
書中有的代碼均使用Python 2.7,並普遍使用了NumPy模塊,若干章中還使用了Matplotlib模塊進行繪圖。能夠安裝Python 2.7的官方發行版,而後依次安裝NumPy和Matplotlib模塊(須要解決依賴)。在這裏推薦直接安裝Python發行版Anaconda,已經內置了不少科學計算所需的模塊,可直接使用。