七本書籍帶你打下機器學習和數據科學的數學基礎

摘要: 本文主要介紹七本關於機器學習和數據科學數學基礎的經典教材,是一份不可多得的書單整理。算法

大多數人學習數據科學的重心放在編程上面,然而,要真正精通數據科學的話是不可以忽視數據科學背後的數據基礎。本篇文章,將分享給讀者我喜歡的七本有關於數據科學基礎的書,下面將逐一爲你們介紹這七本數學基礎書,請你們開始「享受」吧!
首先要明確一點,咱們爲何要爲學習數據科學的數學基礎而努力呢?如下是激勵個人緣由:編程

  1. 人工智能正在快速的改變着世界。Geoffrey Hinton大牛使得咱們從新對BP算法有了新的思考。
  2. 理解背後的數學原理會幫助你更好地理解人工智能的變革。它將幫助你從深度上理解人工智能,與那些淺嘗輒止的研究者區分開來。
  3. 它還將幫助你更好地瞭解人工智能知識產權(IP)的潛力。
  4. 最後,理解數據科學背後的數學知識也能引導你進入人工智能和數據科學更高端的工做。

clipboard.png

1.統計學習理論的本質(The Nature Of Statistical Learning Theory)——Vladimir Vapnik

在數學界中,若是你想建立一個關於數學書的列表並不包括偉大的俄國數學家,那是不可能的。因此,在本文列表中的第一本書籍天然而然就是由Vladimir Vapnik編寫的統計學習理論。該書是七本書中最難找到的一本,固然,在中國這都不是事兒。Vladimir Vapnik也是支持向量機(SVM)算法的創造者,其維基百科頁面上介紹了不少關於他的工做。機器學習

2.模式分類(Pattern Classification)——Richard O Duda

相似於Vladimir Vapnik的書,Duda是另外一個時代的經典書籍。首次發表於1973年,在25年後(2000年)獲得更新,以後再也沒有進行更新,但這並不妨礙本書成爲一本重要的書籍。該書採用模式識別的方法,並涵蓋了大量的算法。佈局

3.機器學習:算法透視(Machine Learning: An Algorithmic Perspective, Second Edition (Chapman & Hall/Crc Machine Learning & Pattern Recognition))——Stephen Marsland

此書如今有第二版,這本書也是我讀過最先的書籍之一。初版和第二版都很好,其中第二版有更多的Python代碼。與前兩本書相似,該書也很是強調算法。學習

4.統計學習要素:數據挖掘、推理和預測(The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Second Edition)——Trevor Hastie, Robert Tibshirani, Jerome Friedman

又一本經典教材,我使用的版本印刷得很是好,具備很高的參考價值。網站

5.模式識別與機器學習(Pattern Recognition and Machine Learning (Information Science and Statistics))——Christopher M. Bishop

Christopher M. Bishop編寫的模式識別和機器學習(信息科學和統計學)也是一本深刻淺出且很是完善的書籍,參考價值高。阿里雲

6.機器學習:理解數據的算法中的藝術和科學(Machine Learning: The Art and Science of Algorithms that Make Sense of Data)——Peter Flach

我喜歡Peter Flach的書籍,儘管購物網站上的一些評論說其有些冗長並缺乏代碼,但我喜歡其整本書的佈局(算法的分組:邏輯模型、線性模型以及機率模型)和主題的總體處理。人工智能

7.深度學習(Deep Learning)——Goodfellow、Bengio和 Corville

該書也被稱做「花書」,內容很詳細且知識新,涵蓋你能想到的一切知識點。
兩個值得推薦的其它資源:spa

機器學習的第一門課程(A First Course in Machine Learning, Second Edition (Machine Learning & Pattern Recognition))——Simon Rogers、Mark Girolami
這本書有初版和第二版,其中初版是我獲得的第一本書,但我不建議初學者看這本書,但這不妨礙該書是本好書(尤爲是第二版)。
機器學習:從概念的角度(Machine Learning: A Probabilistic Perspective )——Kevin Murphy
該書評價很高,但我沒有親自閱讀它,所以沒有放在列表中。
總結
除了「花書」之外,我不會推薦從頭至尾的閱讀。我偏心於按照主題閱讀書籍,即將其做爲參考書,當須要清楚哪部份內容時閱讀相應的內容。經過閱讀以上這些書籍使我以爲本身很謙卑,知道的不多,而機器學習和數據科學領域是多麼的廣闊。
書籍是永恆的,也是不會拋棄本身的朋友,一直在那裏等着你去相遇、相識。Vladimir Vapnik如今已經81歲高齡,Duda這本書首次出版與1973年,我估計50年後,這個行業的從業者仍將閱讀它們,就像經受住時間考驗的老朋友同樣。這展現了基於數學方法的壽命,永不褪色和凋零!翻譯

做者信息
Ajit Jaokar,數據科學家、教師
本文由阿里云云棲社區組織翻譯。
文章原標題《7 Books to Grasp Mathematical Foundations of Data Science and Machine Learning》,譯者:海棠,審校:Uncle_LLD。
詳情請閱讀原文

相關文章
相關標籤/搜索