一文搞定pandas的數據合併

一文搞定pandas的數據合併

在實際處理數據業務需求中,咱們常常會遇到這樣的需求:將多個錶鏈接起來再進行數據的處理和分析,相似SQL中的鏈接查詢功能。
pandas中也提供了幾種方法來實現這個功能,表現最突出、使用最爲普遍的方法是merge。本文中將下面四種方法及參數經過實際案例來進行具體講解。app

  • merge
  • append
  • join
  • concat
    一文搞定pandas的數據合併
    爲方便你們練習,文末提供了本文源代碼的獲取方式。

    文章目錄

    一文搞定pandas的數據合併
    導入庫
    作數據分析的時候這兩個庫是必須導入的,國際慣例通常。ide

import pandas as pd
import numpy as np

— 01 —

merge

官方參數
官方提供的 merge函數的參數以下:
一文搞定pandas的數據合併
下面將經過案例講解幾個重要參數的使用方法:函數

DataFrame.merge(left, right, 
                how='inner',   # {‘left’, ‘right’, ‘outer’, ‘inner’}, default ‘inner’
                on=None, 
                left_on=None, right_on=None, 
                sort=False, 
                suffixes=('_x', '_y'))

模擬數據

注意4組數據的不一樣
一文搞定pandas的數據合併
一文搞定pandas的數據合併code

使用默認參數

兩種不一樣的寫法,效果相同
一文搞定pandas的數據合併blog

參數how

  • how參數的取值有4種:
  • inner(默認)
  • outer
  • right
  • left
    一文搞定pandas的數據合併
    一文搞定pandas的數據合併
    一文搞定pandas的數據合併
    一文搞定pandas的數據合併

    參數on

用於鏈接的列索引列名,必須同時存在於左右的兩個dataframe型數據中,相似SQL中兩個表的相同字段屬性
若是沒有指定或者其餘參數也沒有指定,則以兩個dataframe型數據的相同鍵做爲鏈接鍵排序

on參數爲單個字段索引

一文搞定pandas的數據合併
另外一個例子:
一文搞定pandas的數據合併
一文搞定pandas的數據合併
on參數爲多個字段-列表形式數據分析

一文搞定pandas的數據合併
一文搞定pandas的數據合併

參數lefton/righton

一文搞定pandas的數據合併

參數suffixes

合併的時候一列兩個表同名,可是取值不一樣,若是都想要保存下來,就使用加後綴的方法,默認是 _x,_y,能夠本身指定
一文搞定pandas的數據合併
一文搞定pandas的數據合併pandas

參數sort

對鏈接的時候相同鍵的取值進行排序
一文搞定pandas的數據合併
一文搞定pandas的數據合併it

— 02 —

concat

官方參數

concat方法是將兩個 DataFrame數據框中的數據進行合併

  • 經過axis參數指定是在行仍是列方向上合併
  • 參數 ignore_index實現合併後的索引重排
    一文搞定pandas的數據合併

    生成數據

    一文搞定pandas的數據合併

    指定合併軸

    一文搞定pandas的數據合併

    改變索引

    一文搞定pandas的數據合併
    join參數
    一文搞定pandas的數據合併
    一文搞定pandas的數據合併
    一文搞定pandas的數據合併

    sort-屬性排序

    一文搞定pandas的數據合併
    一文搞定pandas的數據合併

    — 03 —

    append

    官方參數

    一文搞定pandas的數據合併

    基本使用

data3.append(data4)   # 等同於pd.append([data3, data4])  忽略pandas版本的警告

一文搞定pandas的數據合併

改變索引-天然數排序

data3.append(data4, ignore_index=True)  # 設置參數

一文搞定pandas的數據合併

sort=True-屬性的排序

data3.append(data4)   # 默認對字段屬性排序

一文搞定pandas的數據合併

— 04 —

join

官方參數

一文搞定pandas的數據合併

經過相同索引合併

一文搞定pandas的數據合併
一文搞定pandas的數據合併

相同字段屬性指後綴

一文搞定pandas的數據合併
一文搞定pandas的數據合併

相同字段變成索引index

一文搞定pandas的數據合併

相同字段保留一次

一文搞定pandas的數據合併
爲方便你們練習,能夠在公號「Python數據之道」後臺回覆 「20200917」 獲取本文的源代碼文件。
---------End---------
一文搞定pandas的數據合併

相關文章
相關標籤/搜索