Python 數據分析 數據挖掘 學習路徑圖

轉載:本身學習使用html

 

一  學好工具

python語言python

推薦看廖雪峯的python3教程web

數據分析python基礎算法

如list,tuple,dic,set等。我以後的博客會寫到。數據庫

 

二  獲取數據

python爬蟲api

推薦一本書:《Python網絡數據採集》(web Scraping with Python)   Ryan Mitchell 寫的,很是好。讀完這本書+實戰幾回爬蟲你就算熟練了。我以後寫的爬蟲博客也會以讀這本書時的讀書筆記來寫。數組

實戰推薦崔慶才的博客,也能夠看我以後寫的爬蟲實戰博客,我是按照他大框架來進行學習的。網絡

 

三 數據的存儲與讀取

數據的IO,EXCEL,CSV,JSON,SQL數據庫。HDF5等。python爬蟲

 

四 NUMPY PANDAS SCIPY MATPLOTLIB

Numpy數組框架

Pandas 數據分析

Scipy 矩陣

Matplotlib 數據可視化

這一部分推薦看《Python數據分析》(Python Data Analysis)Lvan Idris寫的。

 

五 數據預處理

對採集來或現成的數據進行預處理,數據清洗(推薦看《乾淨的數據=Clean data:數據清洗入門與實踐》做者:Megan Squire),數據集成,數據變換,數據規約等。這一部分有興趣能夠看一本書 《Python數據分析與挖掘實戰》。這本書看個框架就行。其實寫的不咋的。浪費了我很久時間。

 

六 建模 機器學習

學習各類機器學習,數據分析算法。

算法原理推薦看《數據挖掘十大算法》做者:Xindong Wu,Vipin Kumar

python實現推薦看《Python數據分析與挖掘實戰》+《Python數據分析》+《機器學習實戰》

 

七 神經網絡

再往深就是深度學習,神經網絡。

 

寄語:

學習每個都須要付出很大量時間,精力與努力。但願你是真的對數據挖掘,數據分析有興趣。

相關文章
相關標籤/搜索