這篇博客主要總結一下數據挖掘、數據分析領域相關書籍,主要參考了知乎上的問題在數據分析、挖掘方面,有哪些好書值得推薦。算法
首先推薦周志華寫的機器學習。我最近也在讀這本書,優勢是適合入門,知識大而全,缺點是每一個知識點介紹的不深刻(這也沒辦法,要是面面俱到,一本書根本寫不完)。編程
入門讀物
- 深刻淺出數據分析。這書挺簡單的,基本的內容都涉及了,說得也比較清楚,最後談到了R是大加分。難易程度:很是易。
- 啤酒與尿布。經過案例來講事情,並且是最經典的例子。難易程度:很是易。
- 數據之美。一本介紹性的書籍,每章都解決一個具體的問題,甚至還有代碼,對理解數據分析的應用領域和作法很是有幫助。難易程度:易。
- 數學之美。吳軍博士寫的,做爲科普讀物還不錯。
數據分析
- SciPy and NumPy。numpy和scipy很好很強大
- Python for Data Analysis。
- Bad Data Handbook。
數據挖掘入門書籍
- 集體智慧編程。經典書籍,入門必讀。
- 機器學習實戰。理論很好,代碼質量通常般。優勢是讓你看看如何實現這些算法,缺點是書中的代碼幾乎用不上。
- 數據挖掘導論。研究生期間的教材,通俗易懂,習題很贊。
- Machine Learning for Hackers。算法用R實現。
中階
- Introduction to Semi-Supervised Learning
- Learning to Rank for Information Retrieval
- Learning to Rank for Information Retrieval and Natural Language Processing
- 推薦系統實踐。推薦系統入門首選
- Natural Language Processing with Python。NLP 經典,其實主要是講NLTK包
高階
- The Elements of Statistical Learning。很難,啃完不容易。
- 統計學習方法。李航老師的扛鼎之做,強烈推薦。
- Machine Learning。做者Kevin Murrphy教授是機器學習領域中年少有爲的表明。這書是他的集大成之做,寫完以後,就去Google了,產學研結合,沒有比這個更好的了。
- Pattern Recognition And Machine Learning。PRML地位不解釋。
- Bayesian Reasoning and Machine Learning。Bayesian學派的書,裏面的內容很是多,有一張圖將機器學習中設計算法的關係總結了一下,很棒。
- Probabilistic Graphical Models。很是很是難。
- Convex Optimization (豆瓣) 凸優化中最好的教材,沒有之一了。
- Learning from data。林軒田老師做品。
寫在後面,看了肖博士的答案,確實比其餘答案好很多,專業且全面,並且有針對性。除了書籍,後續我會補充一些公開課資源。機器學習