數據分析就是讓數據數據產生價值,經過數據的篩選、彙總等等操做從而分析或預測出事件的變化規律。python語言在數據分析領域一樣扮演者比較強大的角色,其中被樹枝的主要有三個擴展庫用來作數據分析,分別是:pandas、numpy、matplotlib,其中,pandas主要是用做提煉數據使用、numpy則提供強大的科學計算、matplotlib負責數據可視化的操做,三者併成爲python數據分析界的三大劍客。python
在以前操做excel數據時已經接觸過了pandas進行數據提煉的使用,它能夠直接將excel文檔中的數據讀取過來並轉換成python中的dataframe對象。直接對dataframe對象進行操做即可以完成對數據的操做,同時他也支持除excel以外的一些文件格式的數據讀取、提煉的操做等,好比csv文件格式的數據提煉。提取符合條件的數據供後續的分析使用。編程
numpy是一個處理數組模塊、更是數據分析過程的核心,而且能夠支持二維數組、實現矩陣等。
1)數組的建立
2)有關數組的屬性和函數
3)數組元素的獲取--普通索引、切片、布爾索引和花式索引
4)統計函數與線性代數運算
5)隨機數的生成數組
matplotlib是數據可視化重要的工具,將分析的數據經過折線圖、直方圖、散點圖等可視化的方式直接將數據的變化展現在用戶的面前,給用來帶來更直觀的感覺。
圖片微信
對數據分析三劍客有一個簡單的認識,後續將逐步在編程實例中引入pandas,numpy,matplotlib的使用。函數
更多精彩前往微信公衆號【Python 集中營】,專一於 python 技術棧,資料獲取、交流社區、乾貨分享,期待你的加入~工具