總結一下我讀過的機器學習/數據挖掘/數據分析方面的書,有的適合入門,有的適合進階,沒有按照層次排列,先總結一下,等總結的差很少了再根據入門--->進階分塊寫。下面列的書基本上我寫的都是讀完過的,否則不敢寫,怕誤人子弟 = =,持續更新ing~git
數據分析github
實習的時候只會Matlab,公司小,沒錢買正版,因此領導要我兩星期把R學會,當時看的有這些書算法
1.R語言實戰sql
評價:很好的入門書,從安裝、入門、基本的統計分析,做圖命令,以及常見的分類、迴歸、降維等方法都有寫數據庫
推薦指數:五顆星編程
2.數據分析-R語言實戰數據結構
評價:專門用R語言寫的數據分析的書,掌握R的基礎後能夠看看,側重數據分析的基本方法,介紹了一些常見的分析方法,比較基礎。框架
推薦指數:四星半機器學習
3.探索性數據分析工具
評價:外國人寫的書,可是翻譯真的太爛了。並且內容其實沒什麼乾貨啊,關於分位數、展布等這些概念直接找本統計學的教材看看吧。
推薦指數:三顆星
4.R語言編程藝術
評價:在圖書館意外發現了這本好書,對於R中的數據結構和性能提高講的不錯。
推薦指數:四顆星
評價:這本書是pandas模塊的做者寫的書,一句話總結:Pandas使用手冊。若是用Python作數據分析,基本上Pandas是必不可少的包。
推薦指數:四顆星
數據挖掘/機器學習
評價:和上面的「數據分析-R語言實戰」好像是一個系列的,基本上常見的數據挖掘方法都介紹了,有理論有實例,適合入門。
推薦指數:四顆星
評價:入門書,理論多,好像是不少研究生學數據挖掘的教材,很詳細,孟小峯老師的翻譯仍是不錯的,相對不少翻譯很爛的仍是能夠的。
推薦指數:四顆星
6.機器學習實戰
評價:Python寫的,沒有Python基礎的話仍是先學學Python吧,基本上都是實例爲主,代碼很詳細,講的也很通俗易懂,github上能夠下載代碼
推薦指數:五顆星
7.集體智慧編程
評價:和機器學習實戰一塊兒看的,也基本上都是實例,翻譯的也能夠,比「探索性數據分析」的翻譯好多了!!有代碼,能夠實操,基本上真正掌握了能夠應對通常的數據挖掘的需求了。
推薦指數:五顆星
8.統計學習方法
評價:李航博士寫的機器學習常見算法的數學推導,講的算是比較詳細了,對於有數學基礎的仍是很好理解的,若是沒有數學基礎,能夠先看看數分高代凸優化之類的書再看。適合有必定基礎的學習。
推薦指數:五顆星
9.推薦系統實戰
評價:看名字就知道是講推薦系統的,對於不知道推薦系統是啥的能夠好好看看,看完基本上了解推薦系統的大概框架和流程,也有一些例子,可是每一個例子以及理論都講的很淺,沒有深刻,只適合入門。
推薦指數:四顆星
10.數據挖掘導論
評價:實習的同事本科時上課的教材,也是一部大巨頭啊,外國人寫的書,很通俗易懂,很是很是詳細。
推薦指數:四顆星
今天先寫到這兒吧,基本上都是一些入門書,還有一些在印象筆記裏,回去再總結。下次寫看過的hadoop/Python/Spark的書,以及一些比較不錯的論文。
#--------------------------------------------------------------4.12更新--------------------------------------------------------------
11.Spark快速大數據分析
評價:8.4/10,很薄的一本書,主要介紹的Spark的基本語法命令之類的,適合快速入門,Learning Spark的中文版
推薦指數:五顆星
12.Spark高級數據分析
評價:豆瓣上評價不多,可是我買回來看了之後發現仍是不錯的,基本上從分類,聚類,推薦,徵信這幾塊都有實例講解,比較詳細,看的也很快,上手不錯。
推薦指數:五顆星
13.Hadoop權威指南
評價:7.8/10,很厚,Hadoop講的很深,不太適合入門,適合作數據倉庫的人看,數據挖掘的能夠先看看hadoop實戰
推薦指數:三顆星
14.Hadoop實戰
評價:7.0/10,我看的是國內的一個教授寫的,並非「Hadoop in anction」的中文譯本,這個寫的很淺,適合入門,可是感受仍是Hadoop in action 寫的好一些
推薦指數:三星半
15.Hive編程指南
評價:7.4/10 ,講Hive操做的,講真,若是真的只想瞭解下hive怎麼操做,能夠不用看這本書,直接去搜一下hive編程命令集合就能夠了,這本書比較適合ETL的人,若是隻是數據挖掘入門入門的話能夠暫時先不用看這本書。可是書自己講的仍是很好的
推薦指數:四顆星
16.R語言與網站分析
評價:7.4/10,原本只是去國圖偶然看到的一本書,可是看了幾章後以爲講的挺清晰,並且後面的實例講的挺好的,就去亞馬遜上買了kindle電子書,關聯規則和社羣分析講的都挺不錯的,看的特別快。
推薦指數:四顆星
17.R的極客理想工具篇
評價:7.5/10,做者是張丹,最開始是關注他的博客,寫的很清晰,步驟也很明確,對於學習R的人來講是個不錯的學習地方。這本書後面幾張講的主要是R的性能、以及數據庫、hadoop、hive結合起來作的方法,值得一看。
推薦指數:四顆星
18.Mysql必知必會
評價:8.4/10,很少說,入門Mysql必讀書,很薄的一本小冊子。
推薦指數:五顆星
19.高性能MySQL
評價:8.7/10,專業級的MySQL書籍,適合進階,可是中文翻譯很爛,買英文版英文版英文版
推薦指數:兩顆星(還有三顆星給了英文版)
19.凸優化
評價:9.4/10,很好的教材,並且很全,以前上數值分析這門課學的不少內容都包含在裏面了,機器學習的不少概念也能夠在裏面找到,讀完可讓你更深刻的理解機器學習,而不是僅僅只會套用包。
推薦指數:五顆星!!
20.Pattern Recognition and Machine Learning
評價:9.6/10,PRML是機器學習的經典教材啊,很是值得看!有人翻譯了中文版的,若是須要的話能夠留言我把連接發出來~
推薦指數:五顆星
22.統計天然語言處理
評價:8.8/10,作天然語言處理的入門書,書很厚,可是講的不少概念性的東西,卻一點也不以爲枯燥,惟一的缺點就是,大概由於是經典教材類的書,因此實例比較少,有點像綜述,大而全,若是想實戰,能夠看看Python寫的一本天然語言處理的書,nltk,忘記叫啥名了,想起來了貼上來(評論裏有人補充了,貼一個,Natural Language Processing with Python)
推薦指數:四顆星
再推薦幾本科普書,業餘能夠看看提高下興趣
1.從0到1
2.大數據時代
3.浪潮之巔
4.數學之美
5.數據之巔
還有其餘的暫時想不起來了,下次再更新~
#--------------------------------------------------------------4.19更新--------------------------------------------------------------
23.機器學習
評價:上次竟然忘了寫這本書,周志華老師的新書,公式推導很詳細,豆瓣評分9.2,周老師在講數據挖掘的算法以前先講了如何評估算法的效果與選擇,能夠宏觀的瞭解機器學習一些基礎知識,在以後學習算法的時候對於它們的適用場景也會有個大概的瞭解。做者的思路很清晰,強烈推薦啊!!
推薦指數:五顆星