編者注:澳大利亞機器學習專家、暢銷書做者 Jason Brownlee,對機器學習領域的各種優質書籍進行了盤點,彙總成這份閱讀指南。在所篩選的學習資源中,這堪稱是迄今爲止最全面、最完整、權威性比較高的一份 ML 書單,涵蓋了最值得學習者、從業者、開發者認真研讀的精品書目。這份指南適合多樣背景的讀者:從想要了解機器學習的普通人,到入門新手,再到高階開發者和學術研究人員。所以,雷鋒網對其進行編譯整理,特來與你們分享。html
友情提醒:該指南只考慮了英文市場的機器學習圖書,適合你們做爲國際 ML 讀物的參考。而例如周志華老師 《機器學習》等國內優秀著做並無體現,請讀者見諒。算法
Jason Brownlee:編程
我喜歡書,對於搞到的每一本機器學習書籍,我都要去讀。框架
我認爲,有好的參考資源,是對你心中機器學習謎題進行「解惑」的最快方式。閱讀多本書,你就有了看待疑難問題的多種角度。dom
這份指南中,你會發現機器學習領域最值得一讀的好書。iphone
有許多緣由促令人們想要機器學習書籍。所以,我採用了三種不一樣方式對機器學習書籍進行分類、排列,使讀者們能按圖索驥快速查找。比方說:機器學習
依據類別(難易):教材,科普等。ide
依據話題:Python,深度學習等工具
依據出版商:Packt,O’Reilly 等學習
全部書都包括了亞馬遜或京東連接,你能夠點擊連接瞭解更多。
找到一個你最感興趣的話題
瀏覽所選類別的書目
購書、借書、下載
從頭讀到尾
重複以上過程
把書擺在家裏、辦公室顯眼的地方,跟你讀過那本書是兩碼事。別瞎搞收藏。
這是面向普通大衆的機器學習書目。它們讓你體會到機器學習和數據科學的優勢和益處,但免去了理論和應用細節。我還加入了一些我的很是喜歡的、偏「統計思惟」的流行科普讀物。
The Master Algorithm: How the Quest for the Ultimate Learning Machine Will Remake Our World
Predictive Analytics: The Power to Predict Who Will Click, Buy, Lie, or Die
譯本:大數據預測
The Signal and the Noise: Why So Many Predictions Fail–but Some Don't
該類別的首選是: The Signal and the Noise
與上述讀物的樂觀相比,提供了反面觀點的是:Weapons of Math Destruction: How Big Data Increases Inequality and Threatens Democracy.
真正面向零基礎初學者的機器學習書籍,基本上是一片市場空白。下面的這些書,既包含了科普讀物(見 1.1)中使用機器學習的益處,也部分包含了多見於入門書籍(見 1.3)的應用細節。
Data Science for Business: What You Need to Know about Data Mining and Data-Analytic Thinking
Data Smart: Using Data Science to Transform Information into Insight
Data Mining: Practical Machine Learning Tools and Techniques (第四版)
譯本:數據科學實戰
該類別的首選是:Data Mining: Practical Machine Learning Tools and Techniques (數據挖掘:實用機器學習工具與技術)
下面是菜鳥入門的首選書單。至關於本科生級別的機器學習資源,適合基礎學習者以及開發者新手。它們覆蓋了普遍的機器學習話題,傾向於「怎麼作」,而非「爲何」或是探討理論。
Machine Learning for Hackers: Case Studies and Algorithms to Get You Started
譯本:機器學習:實用案例解析
譯本:機器學習實戰
Programming Collective Intelligence: Building Smart Web 2.0 Applications
譯本:集體智慧編程
An Introduction to Statistical Learning: with Applications in R
譯本:統計學習導論:基於R應用
譯本:應用預測建模
該類別的首選是:An Introduction to Statistical Learning: with Applications in R (統計學習導論:基於R應用)
下面是世界一流機器學習教材的列表。這些是研究生課程中會使用到的教科書,覆蓋了一系列方法和背後的理論。
The Elements of Statistical Learning: Data Mining, Inference, and Prediction
Machine Learning: The Art and Science of Algorithms that Make Sense of Data
譯本:機器學習
該類別的首選是: The Elements of Statistical Learning: Data Mining, Inference, and Prediction (統計學習基礎:數據挖掘、推理與預測)
R 語言平臺的應用機器學習書目。
R for Data Science: Import, Tidy, Transform, Visualize, and Model Data
Machine Learning With R Cookbook – 110 Recipes for Building Powerful Predictive Models with R
國內名爲:R語言機器學習參考手冊(英文影印版)
An Introduction to Statistical Learning: with Applications in R
譯本:統計學習導論:基於R應用
譯本:應用預測建模
該類別的首選是:Applied Predictive Modeling(應用預測建模)
使用 Python 或 SciPy 語言平臺的應用機器學習書目。
國內名爲:Python 語言構建機器學習系統(英文影印版)
Introduction to Machine Learning with Python: A Guide for Data Scientists
Machine Learning in Python: Essential Techniques for Predictive Analysis
Python Data Science Handbook: Essential Tools for Working with Data
Introducing Data Science: Big Data, Machine Learning, and more, using Python tools
該類別的首選是: Python Machine Learning (Python 語言構建機器學習系統)
深度學習書目。如今沒幾本深度學習的好書,因此我只得用數量彌補質量。其中有許多專門針對 Tesnorflow 的教程。雷鋒網注:該類推薦書目「全軍覆沒」——沒有一本書有中文譯本。這或許是由於深度學習領域理論框架尚不完善,缺少影響力巨大的著做。
Fundamentals of Deep Learning: Designing Next-Generation Machine Intelligence Algorithms
Learning TensorFlow: A guide to building deep learning systems
TensorFlow for Machine Intelligence: A Hands-On Introduction to Learning Algorithms
該類別毫無疑問的首選是:Deep Learning.
另外,Michael Nielsen 的免費電子書 Neural Networks and Deep Learning 簡單易懂,深受許多入門學習者的喜好,雷鋒網將其添加在這裏,以做補充。
時間序列預測領域最值得一讀的書目。在該技術的應用方面,目前 R 語言是霸主。
該類別的入門首選是:Forecasting: principles and practice.
該類別的首選教材是:Time Series Analysis: Forecasting and Control.
有三個出版商在機器學習領域下了大力氣,而且在認真出版圖書。
它們是: O'Reilly, Manning 和 Packt。它們的焦點是應用書籍。該榜單上的書籍質量良莠不齊:從嚴謹設計、編排的圖書到裝訂在一塊兒的博文。
在它們的「數據」類別,O'Reilly 有超過 100 本圖書,許多與機器學習相關。如下是最暢銷的幾本:
Programming Collective Intelligence: Building Smart Web 2.0 Applications
譯本:集體智慧編程
Introduction to Machine Learning with Python: A Guide for Data Scientists
Fundamentals of Deep Learning: Designing Next-Generation Machine Intelligence Algorithms
Data Science from Scratch: First Principles with Python
譯本:數據科學入門
Python Data Science Handbook: Essential Tools for Working with Data
這些書中,Programming Collective Intelligence: Building Smart Web 2.0 Applications (集體智慧編程) 或許是開創了 O'Reilly 該目錄的書,一直很受歡迎。
Manning 的書偏實用,而且質量還行,雖然數量沒 O’Reilly 和 Packt 那麼多。
Manning 目錄裏較突出的一本是 Machine Learning in Action(機器學習實戰),這也許一樣是由於,它是該出版社在機器學習和數據科學領域的第一本出版物。
感受上 Packt 全面擁抱了數據科學和機器學習領域的圖書出版。他們有一大堆針對晦澀難懂機器學習庫的書。在流行話題上面,好比 R 和 Python,也有很多書籍出版。雷鋒網注:惋惜的是,Packt 彷佛不重視漢語市場,旗下主要機器學習圖書並無中文譯本。
如下是一些較流行的書目: