數據挖掘、數據分析的書籍推薦

這篇博客主要總結一下數據挖掘、數據分析領域相關書籍,主要參考了知乎上的問題在數據分析、挖掘方面,有哪些好書值得推薦算法

首先推薦周志華寫的機器學習。我最近也在讀這本書,優勢是適合入門,知識大而全,缺點是每一個知識點介紹的不深刻(這也沒辦法,要是面面俱到,一本書根本寫不完)。編程

入門讀物

  • 深刻淺出數據分析。這書挺簡單的,基本的內容都涉及了,說得也比較清楚,最後談到了R是大加分。難易程度:很是易。
  • 啤酒與尿布。經過案例來講事情,並且是最經典的例子。難易程度:很是易。
  • 數據之美。一本介紹性的書籍,每章都解決一個具體的問題,甚至還有代碼,對理解數據分析的應用領域和作法很是有幫助。難易程度:易。
  • 數學之美。吳軍博士寫的,做爲科普讀物還不錯。

數據分析

  • SciPy and NumPy。numpy和scipy很好很強大
  • Python for Data Analysis。
  • Bad Data Handbook。

數據挖掘入門書籍

  • 集體智慧編程。經典書籍,入門必讀。
  • 機器學習實戰。理論很好,代碼質量通常般。優勢是讓你看看如何實現這些算法,缺點是書中的代碼幾乎用不上。
  • 數據挖掘導論。研究生期間的教材,通俗易懂,習題很贊。
  • Machine Learning for Hackers。算法用R實現。

中階

  • Introduction to Semi-Supervised Learning
  • Learning to Rank for Information Retrieval
  • Learning to Rank for Information Retrieval and Natural Language Processing
  • 推薦系統實踐。推薦系統入門首選
  • Natural Language Processing with Python。NLP 經典,其實主要是講NLTK包

高階

  • The Elements of Statistical Learning。很難,啃完不容易。
  • 統計學習方法。李航老師的扛鼎之做,強烈推薦。
  • Machine Learning。做者Kevin Murrphy教授是機器學習領域中年少有爲的表明。這書是他的集大成之做,寫完以後,就去Google了,產學研結合,沒有比這個更好的了。
  • Pattern Recognition And Machine Learning。PRML地位不解釋。
  • Bayesian Reasoning and Machine Learning。Bayesian學派的書,裏面的內容很是多,有一張圖將機器學習中設計算法的關係總結了一下,很棒。
  • Probabilistic Graphical Models。很是很是難。
  • Convex Optimization (豆瓣) 凸優化中最好的教材,沒有之一了。
  • Learning from data。林軒田老師做品。

寫在後面,看了肖博士的答案,確實比其餘答案好很多,專業且全面,並且有針對性。除了書籍,後續我會補充一些公開課資源。機器學習

相關文章
相關標籤/搜索