以前學了用python製做爬蟲去爬取數據,可是不知道數據有什麼用途。在請教慘綠青年小哥哥後,得知數據能夠用pandas庫進行數據分析而後得出有用的信息。python果真厲害,還能用來進行數據分析。在小哥哥的教導下,Paradoxical總算掌握了pandas的基本用法,一塊兒來學習吧~
python
首先咱們要安裝pandas庫,在命令行輸入「pip install pandas」就能夠安裝了。數據結構
先說說pandas的經常使用數據結構DataFrame,這是相似表格的結構,由若干行和列組成,你們能夠將它看成一個表格來看。下面是使用ExcelFile()讀取練習數據文件的代碼,能夠看到df對象是DataFrame類型。app
有些列是不須要的,因此咱們只提取有用的列便可。ide
還有另外一種經常使用的提取方法loc。學習
也能夠直接用「.」和「[]」來提取列。spa
數據提取方法掌握這些就能夠了,接下來看一下其餘方面的。命令行
查看數據表屬性orm
能夠用如下方法查看數據表的屬性。對象
對數據表的數據進行清洗blog
能夠用如下方法對數據進行清洗。
對數據表的數據進行統計
能夠用如下方法對數據進行統計。
對數據表的數據進行篩選
能夠用如下方法對數據進行篩選。結合上面的統計方法使用也能夠的。
對數據表的數據進行彙總
能夠用如下方法對數據進行彙總。
pandas的功能還有不少,這裏只展現了一部分,你們能夠參考pdf去挖掘更多的功能哦~