利用PYTHON進行數據分析 學習筆記

Python for Data Analysis 這本書是唐學韜老師帶領的團隊在2013年就翻譯完畢的著做。原書做者是美國的McKinney.W.。如今是2019年,Python的使用如火如荼,我不知道它是否已經發展成熟。Just do it.如今開始。。。也不晚html

Python 給人的初次印象很是的好,工整、語法邏輯清晰,能夠說很是相似於英語的天然語法了(我是說和一段標準的英文對話很相似了)。數組

做爲一個初學者,我最最對Python感到崇拜的,就是它的LIST 和 for...in...:迭代循環,仔細想一想其實咱們的工做方式和思考方式就是這麼個樣子,把工做內容或思想排列成清單,而後一項項地處理。。。一項項地處理。。。,在迭代中,作出各類判斷、給出其後的結果、或是論斷。那本著名的《Head First Python》中開篇就告訴大夥——人人都愛LIST框架

 

本書中所說的「數據」,主要指的是結構化數據(structured data),好比:學習

  • 多維數組(矩陣)
  • 表格型數據
  • 經過關鍵列(對於SQL用戶而言,就是主鍵和外鍵)相互聯繫的多個表
  • 間隔平均或不平均的時間序列
 

爲何要使用Python進行數據分析

我之前讀一本教程時,最常作的事情之一就是忽略文章中的「爲何。。。」章節,我覺得我既然看這本書,就是知道「爲何」,如今我明白,原來我是那麼的「錯」,看教程必定要仔細研讀其中的「爲何。。。」;之前,我常作的另外一件錯事,就是基本不看書的「目錄」,若是你也有這種習慣,讓咱們一塊兒改正吧。操作系統

  • Python適合巨量的數據處理
  • Python適合複雜的數據分析
  • WEB框架(Django)
  • 活躍的科學計算社區
  • 豐富的「庫」資源
  • Python是計算機語言「粘合劑」

徹底能夠只使用Python一種語言來構建以數據爲中心的應用程序。通俗地說,Python最適合於統計學、探索性需求。做爲一個科學計算平臺,Python成功地集成C、C++、Fortran代碼。翻譯

 

重要的Python庫

利用Python進行數據分析,根本就是在和各類庫在打交道,下面是最最經常使用的:htm

  • NumPy
  • Pandas
  • matplotlib
  • SciPy
 

安裝和設置

爲了數據處理而使用Python,就讓咱們在64base操做系統環境下,安裝一個Anaconda(64-bit)環境吧,一路「next」,幾乎不會出錯。而後,全部其餘須要安裝的庫,就「pip install module_name」,很是好使啊。教程

這一篇應該就是踏入數據分析的開始吧。我會堅持繼續學習,也會繼續修改上面這些文字,當我學得更深時,我也許會把上面的文字改的面目全非。ip

相關文章
相關標籤/搜索