對不起,給pandas配表情包太難了,pandas你該這麼學,No.6

若是圖片沒法觀看,請移步 https://blog.csdn.net/hihell

標題起的長,才能引發你的注意呢

昨天,有個傢伙,留言給我說
嫌我很差好寫博客函數

就知道給文章配表情包學習

在這裏,鄭重的回覆一下.net

我願意(╬◣д◢)
在這裏插入圖片描述翻譯

上篇博客,咱們搗鼓了屬性和簡單的幾個函數

這篇博客,咱們繼續圍繞着dataframe轉圈圈吧3d

首先從計算函數提及code

咱先聲明一個dataframe,方便後續操做blog

import pandas as pd

df_dict = {
    "boys":[10,20,30],
    "girls":[20,40,60]
}

df = pd.DataFrame(df_dict)
print(df)

對於一個高手來講,從上帝視角對數據有一個基本的把握是最重要的索引

那麼咱們須要一個函數圖片

describeget

你只須要使用一下,就能獲得不少的信息哦~

來,看一下結果

boys  girls
count   3.0    3.0
mean   20.0   40.0
std    10.0   20.0
min    10.0   20.0
25%    15.0   30.0
50%    20.0   40.0
75%    25.0   50.0
max    30.0   60.0

這不要啥有啥麼

只要你英文沒啥大問題,認識count,mean,std,min,max

恭喜你,上面的數據
你都能看懂

這上帝視角

數據盡收眼底
在這裏插入圖片描述

接下來,你就能夠分開顯示了

pandas神奇的地方即將出現

當你學會一個函數
同步你會學會好幾個

我拿count舉個栗子啊
爲何,拿着個舉例子

還不是由於它最簡單!

先看代碼,在講解

import pandas as pd
df_dict = {
    "boys":[10,20,30],
    "girls":[20,40,60]
}
df = pd.DataFrame(df_dict)
print(df.count(axis=0))

輸出的結果,請注意

boys     3
girls    3
dtype: int64

是個series沒錯了

那麼,重點來了,我這個僞大佬要開課了

df.count()函數,統計cells個數,
額,仍是大白話吧

就是統計行或者列的小格子個數

在這裏插入圖片描述

嗯,這麼說,容易懂

它有個參數,很是,很是,很是重要

之後會常常碰到

這個參數,就是axis,翻譯成中文,叫作軸

沒錯,就是座標軸的那個軸

默認值呢是0

0等於index
1等於columns

難度來了,這個地方很差記(由於,我老是搞錯 Σ(っ°Д°;)っ)

在這裏插入圖片描述

在嘗試大白話解釋一下df.count(axis=0)的意思

統計每一列單元格(小格子)數量

咦?不太對啊

剛剛不是還說0等於index麼?

df.count(axis=0),不該該統計行麼?咋還統計成列了呢?

解釋最後一次了哦

axis=0 這個參數表示爲每列生成計數
在這裏插入圖片描述
上面的紅框,叫作每列

因此,列名有幾個,統計出來的結果就有幾個

這個很容易暈哦~

我以爲你應該暈了

哎~慢慢繞吧
在這裏插入圖片描述

同理axis=1就表示爲每行生成計數

剛剛的數據有三行,那對應的確定生成三行嘍

小提示

axis='index' 等於  axis = 0
axis = 'columns' 等於 axis = 1

爲何要在這個地方叨叨這麼多呢

還不是由於下面這個圖

在這裏插入圖片描述
看完這個圖,以後

我相信,你應該對axis這個函數瞬間感興趣了

在這裏插入圖片描述

這徹底搞不定,無法用的節奏啊

難不成,每次都跟我同樣

先猜0,不對,在換成1

哈哈哈哈哈哈哈哈哈
(好像暴露了,我菜的本質了呢)

在這裏插入圖片描述

df.count()學習完畢以後,來個df.min(),df.max(),df.mean()吧

哈哈,這三個函數咱看一下,其實很是簡單的

import pandas as pd
df_dict = {
    "boys":[10,20,30],
    "girls":[20,40,60]
}
df = pd.DataFrame(df_dict,index=['class1','class2','class3'])
print(df.mean(axis=1))
  • df.min() 最小值
  • df.max() 最大值
  • df.mean() 平均值

上面是獲取值

記住,有值就有索引

而後再展現一段代碼

需求,咱們要獲取每列中最小值的索引

import pandas as pd

df_dict = {
    "boys":[10,20,30],
    "girls":[20,40,60]
}

df = pd.DataFrame(df_dict,index=['class1','class2','class3'])
print(df.mean(axis=1))
print(df.idxmin())
  • df.idxmin() 按照列獲取
  • df.idxmin(axis=1) 按照行獲取

電腦面前的你,趕忙的吧,

你一試就知道結果了

還等什麼?

其餘的,像方差,求和,標準差,都去試試吧

你能夠滴!
在這裏插入圖片描述

T來了

在學習series的時候,咱們用了一個s.T
神奇的是啥效果也沒有

今天用dataframe在來試一下

import pandas as pd

df_dict = {
    "boys":[10,20,30],
    "girls":[20,40,60]
}

df = pd.DataFrame(df_dict,index=['class1','class2','class3'])

print(df)
print("x"*50)

print(df.T)

在這裏插入圖片描述

看到沒?
出現效果了

行索引,變成列索引
列索引,變成行索引

厲害,厲害

其實這個就是轉置

線性代數上線啦

下課!

在這裏插入圖片描述

話很少說,結束,開始展現公衆號

在這裏插入圖片描述 還等什麼,關注吧~

相關文章
相關標籤/搜索