series對象html
1.聲明series對象數據庫
沒有指定標籤:json
指定標籤:數組
查看組成series對象的:index和values數據結構
2.選擇內部元素:app
3.爲元素賦值:函數
4.用numpy數組或其餘series對象定義新series對象excel
5.篩選元素:orm
6.series對象運算和數學函數htm
7.seri對象的組成元素:
unique()
value_counts()
isiin()
8.NaN(非數值)
9.series用做字典
10.series對象之間的用算
DataFrame對象
1.定義DataFrame對象
2.選取元素
3.賦值
4.元素的所屬關係
5.刪除一列
6.篩選
7.用嵌套字典生成DataFrame對象
8.DataFrame轉置
Index對象
1.index對象的方法
2.含有重複標籤的Index
索引對象的其餘功能
1.更換索引:reindex()
2.刪除:
3.算數和數據對齊
數據結構之間的運算:
1.算數運算:
add()
sub()
div()
mul()
2.series對象和DataFrame對象之間的運算
pandas庫函數:
np.sort()計算DataFrame每一個對象的平方根
fame.apply(f,axis=1):f爲自定義函數,axis肯定操做的是行仍是列
sum():計算DataFrame對象元素之和
mean():平均值
describe():計算多個統計量
索引排序:sort_index()
元素排序:
1.Serise對象使用order()函數
2. DataFrame對象:sort_index()函數,by指定哪一列,多列放在數組傳給by
ranking排序:rank()函數
相關性與協方差:corr()和cov()
corrwith()能夠計算Dataframe對象的的列或行與Serise對象或其餘Dataframe對象元素兩輛之間的相關性。
爲元素賦NaN值:np.NaN
過濾NaN:1. dropna():how選項避免刪除整行或整列
2. notnull()做爲選取元素的條件,實現直接過濾。
爲NaN元素填充其餘值:fillna()
等級索引:unstack():把Serise對象轉換爲DataFrame對象
stack()相反
swaplevel()函數以要互相交換兩個層級的的名稱爲參數,返回交換位置後一個的一個新對象,其中各元素的順序保持不變
sortlevel()只根據一個層級對數據排序
level參數對層級進行統計
讀取函數和寫入函數:
cvs和文本文件:read_cvs(),read_table(),to_cvs()具體參數,正則解析TXT文件。
讀寫html文件:
read_html()
to_html()
讀寫Excel文件:
to_excel()
read_excel()
json文件:
read_json()
to_json()
json_normalize()
pandas實現對象序列化
pandas對接數據庫