Pandas基於兩種數據類型:series與dataframe。
一個series是一個一維的數據類型,其中每個元素都有一個標籤。series相似於Numpy中元素帶標籤的數組。其中,標籤能夠是數字或者字符串。
一個dataframe是一個二維的表結構。Pandas的dataframe能夠存儲許多種不一樣的數據類型,而且每個座標軸都有本身的標籤。你能夠把它想象成一個series的字典項。數組
1、讀取csv文件爲dataframe
2、dataframe的數據概況
3、取列數據
4、取行數據
5、取某一單元格數據
6、缺失值處理
7、歸一化處理
8、排序
9、索引從新編號
10、求均值
11、矢量化操做(批量操做)
12、透視表spa
Pandas很好的一點是,能夠操做表文件。輸出爲dataframe格式,這點很nice。 使用pandas.read_csv()讀取csv文件,輸出爲dataframe格式數據。 這裏數據data.csv數據集下載自百度地圖。排序
import pandas as pd filepath = r'C:/Users/lenovo/Desktop/20180108-百度地圖/20180108-百度地圖/data.csv' df = pd.read_csv(filepath) #爲了方便,我只顯示三行,其實結果並非這樣子 print(df)索引
檢測下數據格式字符串
#檢測下數據格式是否爲DataFrame print(type(df))pandas
#輸出class 'pandas.core.frame.DataFrame百度地圖
咱們想知道數據以下知識:class
展現dataframe先後幾條記錄import
顯示dataframe的列名字百度
查看dataframe的維度狀況(幾行幾列)