Pandas具備功能全面的高性能內存中鏈接操做,與SQL等關係數據庫很是類似。
Pandas提供了一個單獨的merge()
函數,做爲DataFrame對象之間全部標準數據庫鏈接操做的入口 -python
pd.merge(left, right, how='inner', on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=True)
在這裏,有如下幾個參數可使用 -數據庫
True
,則使用左側DataFrame中的索引(行標籤)做爲其鏈接鍵。 在具備MultiIndex(分層)的DataFrame的狀況下,級別的數量必須與來自右DataFrame的鏈接鍵的數量相匹配。True
,設置爲False
時,在不少狀況下大大提升性能。如今建立兩個不一樣的DataFrame並對其執行合併操做。數組
如何合併參數指定如何肯定哪些鍵將被包含在結果表中。若是組合鍵沒有出如今左側或右側表中,則鏈接表中的值將爲NA
。函數
這裏是how
選項和SQL等效名稱的總結 -性能
合併方法 | SQL等效 | 描述 |
---|---|---|
left |
LEFT OUTER JOIN |
使用左側對象的鍵 |
right |
RIGHT OUTER JOIN |
使用右側對象的鍵 |
outer |
FULL OUTER JOIN |
使用鍵的聯合 |
inner |
INNER JOIN |
使用鍵的交集 |
#!/usr/bin/env python # -*- coding: utf-8 -*- # @Time : 2018/5/24 15:03 # @Author : zhang chao # @File : s.py import pandas as pd left = pd.DataFrame({ 'id':[1,2,3,4,5], 'Name': ['Alex', 'Amy', 'Allen', 'Alice', 'Ayoung'], 'subject_id':['sub1','sub2','sub4','sub6','sub5']}) right = pd.DataFrame( {'id':[1,2,3,4,5], 'Name': ['Billy', 'Brian', 'Bran', 'Bryce', 'Betty'], 'subject_id':['sub2','sub4','sub3','sub6','sub5']}) print (left) print("========================================") print (right) print("========================================") print("在一個鍵上合併兩個數據幀,how - 它是left, right, outer以及inner之中的一個,默認爲內inner爲交集") rs = pd.merge(left,right,on='id')#在一個鍵上合併兩個數據幀,how - 它是left, right, outer以及inner之中的一個,默認爲內inner print(rs) print("========================================") print("合併多個鍵上的兩個數據框,默認爲交集:") rs = pd.merge(left,right,on=['id','subject_id']) print(rs) print("========================================") print("使用左側對象的鍵:") rs = pd.merge(left, right, on='subject_id', how='left') print (rs) print("========================================") print("使用鍵的聯合:") rs = pd.merge(left, right, how='outer', on='subject_id') print (rs) print("========================================") print("使用鍵的交集:") rs = pd.merge(left, right, how='inner', on='subject_id') print (rs) D:\Download\python3\python3.exe D:/Download/pycharmworkspace/s.py Name id subject_id 0 Alex 1 sub1 1 Amy 2 sub2 2 Allen 3 sub4 3 Alice 4 sub6 4 Ayoung 5 sub5 ======================================== Name id subject_id 0 Billy 1 sub2 1 Brian 2 sub4 2 Bran 3 sub3 3 Bryce 4 sub6 4 Betty 5 sub5 ======================================== 在一個鍵上合併兩個數據幀,how - 它是left, right, outer以及inner之中的一個,默認爲內inner爲交集 Name_x id subject_id_x Name_y subject_id_y 0 Alex 1 sub1 Billy sub2 1 Amy 2 sub2 Brian sub4 2 Allen 3 sub4 Bran sub3 3 Alice 4 sub6 Bryce sub6 4 Ayoung 5 sub5 Betty sub5 ======================================== 合併多個鍵上的兩個數據框,默認爲交集: Name_x id subject_id Name_y 0 Alice 4 sub6 Bryce 1 Ayoung 5 sub5 Betty ======================================== 使用左側對象的鍵: Name_x id_x subject_id Name_y id_y 0 Alex 1 sub1 NaN NaN 1 Amy 2 sub2 Billy 1.0 2 Allen 3 sub4 Brian 2.0 3 Alice 4 sub6 Bryce 4.0 4 Ayoung 5 sub5 Betty 5.0 ======================================== 使用鍵的聯合: Name_x id_x subject_id Name_y id_y 0 Alex 1.0 sub1 NaN NaN 1 Amy 2.0 sub2 Billy 1.0 2 Allen 3.0 sub4 Brian 2.0 3 Alice 4.0 sub6 Bryce 4.0 4 Ayoung 5.0 sub5 Betty 5.0 5 NaN NaN sub3 Bran 3.0 ======================================== 使用鍵的交集: Name_x id_x subject_id Name_y id_y 0 Amy 2 sub2 Billy 1 1 Allen 3 sub4 Brian 2 2 Alice 4 sub6 Bryce 4 3 Ayoung 5 sub5 Betty 5 Process finished with exit code 0