摘要: 本文主要介紹七本關於機器學習和數據科學數學基礎的經典教材,是一份不可多得的書單整理。算法
大多數人學習數據科學的重心放在編程上面,然而,要真正精通數據科學的話是不可以忽視數據科學背後的數據基礎。本篇文章,將分享給讀者我喜歡的七本有關於數據科學基礎的書,下面將逐一爲你們介紹這七本數學基礎書,請你們開始「享受」吧!
首先要明確一點,咱們爲何要爲學習數據科學的數學基礎而努力呢?如下是激勵個人緣由:編程
在數學界中,若是你想建立一個關於數學書的列表並不包括偉大的俄國數學家,那是不可能的。因此,在本文列表中的第一本書籍天然而然就是由Vladimir Vapnik編寫的統計學習理論。該書是七本書中最難找到的一本,固然,在中國這都不是事兒。Vladimir Vapnik也是支持向量機(SVM)算法的創造者,其維基百科頁面上介紹了不少關於他的工做。機器學習
相似於Vladimir Vapnik的書,Duda是另外一個時代的經典書籍。首次發表於1973年,在25年後(2000年)獲得更新,以後再也沒有進行更新,但這並不妨礙本書成爲一本重要的書籍。該書採用模式識別的方法,並涵蓋了大量的算法。佈局
此書如今有第二版,這本書也是我讀過最先的書籍之一。初版和第二版都很好,其中第二版有更多的Python代碼。與前兩本書相似,該書也很是強調算法。學習
又一本經典教材,我使用的版本印刷得很是好,具備很高的參考價值。網站
Christopher M. Bishop編寫的模式識別和機器學習(信息科學和統計學)也是一本深刻淺出且很是完善的書籍,參考價值高。阿里雲
我喜歡Peter Flach的書籍,儘管購物網站上的一些評論說其有些冗長並缺乏代碼,但我喜歡其整本書的佈局(算法的分組:邏輯模型、線性模型以及機率模型)和主題的總體處理。人工智能
該書也被稱做「花書」,內容很詳細且知識新,涵蓋你能想到的一切知識點。
兩個值得推薦的其它資源:spa
機器學習的第一門課程(A First Course in Machine Learning, Second Edition (Machine Learning & Pattern Recognition))——Simon Rogers、Mark Girolami
這本書有初版和第二版,其中初版是我獲得的第一本書,但我不建議初學者看這本書,但這不妨礙該書是本好書(尤爲是第二版)。
機器學習:從概念的角度(Machine Learning: A Probabilistic Perspective )——Kevin Murphy
該書評價很高,但我沒有親自閱讀它,所以沒有放在列表中。
總結
除了「花書」之外,我不會推薦從頭至尾的閱讀。我偏心於按照主題閱讀書籍,即將其做爲參考書,當須要清楚哪部份內容時閱讀相應的內容。經過閱讀以上這些書籍使我以爲本身很謙卑,知道的不多,而機器學習和數據科學領域是多麼的廣闊。
書籍是永恆的,也是不會拋棄本身的朋友,一直在那裏等着你去相遇、相識。Vladimir Vapnik如今已經81歲高齡,Duda這本書首次出版與1973年,我估計50年後,這個行業的從業者仍將閱讀它們,就像經受住時間考驗的老朋友同樣。這展現了基於數學方法的壽命,永不褪色和凋零!翻譯
做者信息
Ajit Jaokar,數據科學家、教師
本文由阿里云云棲社區組織翻譯。
文章原標題《7 Books to Grasp Mathematical Foundations of Data Science and Machine Learning》,譯者:海棠,審校:Uncle_LLD。
詳情請閱讀原文