轉載:本身學習使用html
python語言python
推薦看廖雪峯的python3教程。web
數據分析python基礎算法
如list,tuple,dic,set等。我以後的博客會寫到。數據庫
python爬蟲api
推薦一本書:《Python網絡數據採集》(web Scraping with Python) Ryan Mitchell 寫的,很是好。讀完這本書+實戰幾回爬蟲你就算熟練了。我以後寫的爬蟲博客也會以讀這本書時的讀書筆記來寫。數組
實戰推薦崔慶才的博客,也能夠看我以後寫的爬蟲實戰博客,我是按照他大框架來進行學習的。網絡
數據的IO,EXCEL,CSV,JSON,SQL數據庫。HDF5等。python爬蟲
Numpy數組框架
Pandas 數據分析
Scipy 矩陣
Matplotlib 數據可視化
這一部分推薦看《Python數據分析》(Python Data Analysis)Lvan Idris寫的。
對採集來或現成的數據進行預處理,數據清洗(推薦看《乾淨的數據=Clean data:數據清洗入門與實踐》做者:Megan Squire),數據集成,數據變換,數據規約等。這一部分有興趣能夠看一本書 《Python數據分析與挖掘實戰》。這本書看個框架就行。其實寫的不咋的。浪費了我很久時間。
學習各類機器學習,數據分析算法。
算法原理推薦看《數據挖掘十大算法》做者:Xindong Wu,Vipin Kumar
python實現推薦看《Python數據分析與挖掘實戰》+《Python數據分析》+《機器學習實戰》
再往深就是深度學習,神經網絡。
學習每個都須要付出很大量時間,精力與努力。但願你是真的對數據挖掘,數據分析有興趣。