pandas 數據排序.sort_index()和.sort_values()

時間 2020-04-09

標籤 pandas 數據排序 sort index values 简体版

原文原文鏈接

原文連接：https://www.jianshu.com/p/f0ed06cd5003python

import pandas as pd
df = pd.DataFrame(……)
說明：如下「df」爲DataFrame對象。ui

1. df. sort_values()

做用：既能夠根據列數據，也可根據行數據排序。
注意：必須指定by參數，即必須指定哪幾行或哪幾列；沒法根據index名和columns名排序（由.sort_index()執行）spa

調用方式

DataFrame.sort_values(by, axis=0, ascending=True, inplace=False, kind='quicksort', na_position='last')
axis：{0 or ‘index’, 1 or ‘columns’}, default 0，默認按照列排序，即縱向排序；若是爲1，則是橫向排序。
by：str or list of str；若是axis=0，那麼by="列名"；若是axis=1，那麼by="行名"。
ascending：布爾型，True則升序，若是by=['列名1','列名2']，則該參數能夠是[True, False]，即第一字段升序，第二個降序。
inplace：布爾型，是否用排序後的數據框替換現有的數據框。
kind：排序方法，{‘quicksort’, ‘mergesort’, ‘heapsort’}, default ‘quicksort’。彷佛不用太關心。
na_position：{‘first’, ‘last’}, default ‘last’，默認缺失值排在最後面。code

例：

原數據對象

df = pd.DataFrame({'b':[1,2,3,2],'a':[4,3,2,1],'c':[1,3,8,2]},index=[2,0,1,3]) 
    b   a   c
2   1   4   1
0   2   3   3
1   3   2   8
3   2   1   2

1.按b列升序排序blog

df.sort_values(by='b') #等同於df.sort_values(by='b',axis=0)
    b   a   c
2   1   4   1
0   2   3   3
3   2   1   2
1   3   2   8

2.先按b列降序，再按a列升序排序排序

df.sort_values(by=['b','a'],axis=0,ascending=[False,True]) 
    b   a   c
1   3   2   8
3   2   1   2
0   2   3   3
2   1   4   1

3.按行3升序排列rem

df.sort_values(by=3,axis=1) #必須指定axis=1
    a   b   c
2   4   1   1
0   3   2   3
1   2   3   8
3   1   2   2

4.按行3升序，行0降排列文檔

df.sort_values(by=[3,0],axis=1,ascending=[True,False])
    a   c   b
2   4   1   1
0   3   3   2
1   2   8   3
3   1   2   2

注意：指定多列（多行）排序時，先按排在前面的列（行）排序，若是內部有相同數據，再對相同數據內部用下一個列（行）排序，以此類推。如何內部無重複數據，則後續排列不執行。即首先知足排在前面的參數的排序，再排後面參數get

2. df. sort_index()

做用：默認根據行標籤對全部行排序，或根據列標籤對全部列排序，或根據指定某列或某幾列對行排序。
注意：df. sort_index()能夠完成和df. sort_values()徹底相同的功能，但python更推薦用只用df. sort_index()對「根據行標籤」和「根據列標籤」排序，其餘排序方式用df.sort_values()。

調用方式

sort_index(axis=0, level=None, ascending=True, inplace=False, kind='quicksort', na_position='last', sort_remaining=True, by=None)
axis：0按照行名排序；1按照列名排序
level：默認None，不然按照給定的level順序排列---貌似並非，文檔
ascending：默認True升序排列；False降序排列
inplace：默認False，不然排序以後的數據直接替換原來的數據框
kind：排序方法，{‘quicksort’, ‘mergesort’, ‘heapsort’}, default ‘quicksort’。彷佛不用太關心。
na_position：缺失值默認排在最後{"first","last"}
by：按照某一列或幾列數據進行排序，可是by參數貌似不建議使用

例：

源數據

import pandas as pd  
df = pd.DataFrame({'b':[1,2,2,3],'a':[4,3,2,1],'c':[1,3,8,2]},index=[2,0,1,3]) 
    b   a   c
2   1   4   1
0   2   3   3
1   3   2   8
3   2   1   2

1.默認按「行標籤」升序排列（推薦）

df.sort_index() #默認按「行標籤」升序排序，或df.sort_index(axis=0, ascending=True)
    b   a   c
0   2   3   3
1   3   2   8
2   1   4   1
3   2   1   2

2.按「列標籤」升序排列（推薦）

df.sort_index(axis=1) #按「列標籤」升序排序
    a   b   c
2   4   1   1
0   3   2   3
1   2   3   8
3   1   2   2

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。