import pandas as pd
約定俗稱爲pdpython
https://pandas.pydata.org/pandas-docs/stable/?v=20190307135750app
import numpy as np import pandas as pd arr = np.array([1, 2, 3, 4, np.nan, ]) s = pd.Series(arr) print(s) #也能夠不轉換,可是轉換後能夠減小內存,儘可能進行轉換 # arr = np.array([1, 2, 3, 4, np.nan, ]) s = pd.Series([1, 2, 3, 4, np.nan, ]) print(s)
df = pd.DataFrame(數據內容,index=縱座標,columns=橫座標)#數據內容必須是列表或者np.array格式,儘可能用np.array格式減小內存 #生成的數據列表預約俗稱最好命名成df #對df的取值
屬性 | 詳解 |
---|---|
dtype | 查看數據類型 |
index | 查看行序列或者索引 |
columns | 查看各列的標籤 |
values | 查看數據框內的數據,也即不含表頭索引的數據 |
describe | 查看數據每一列的極值,均值,中位數,只可用於數值型數據 |
transpose | 轉置,也可用T來操做 |
sort_index | 排序,可按行或列index排序輸出 |
sort_values | 按數據值來排序 |
取縱座標code
取橫座標對象
取填入的數據而且爲array格式排序
計數列表的各個列的個數,最大值,最小值等等索引
橫縱座標進行對調內存
根據axis=0或者1按照橫座標或者縱座標進行排序文檔
按照值進行排序,默認是豎着排序,也能夠經過設置axis=0或者1進行修改,默認升序get
用切片進行df[0:1]取第一行,可是開始的話橫縱座標是不算在裏面的pandas
df.loc[開始的縱座標名稱:結束的縱座標名稱]
取某一行,df[這行的對應的橫座標]
取多行,df[[第一列的對應的橫座標,第二列的對應的橫座標]]以此類推
按行取值df.iloc[2, 1] 第3行第二個
df.iloc[1:4, 1:4] 橫座標是,第2個到第5個,縱向是第二個到第五個
df[df['c1'] > 0] 結合上面取值進行判斷
結合上面取值進行替換
axis進行行列選擇,橫着加仍是豎着加
刪除行不爲4個值的
刪除c2中有NaN值的數據
df.fillna(value=10)空值填充10
1.pd.concat((df1, df2), axis=1)
合併行列均可以由axis控制
2.df1.append(df2)
append只能合併列