昨天,有個傢伙,留言給我說 嫌我很差好寫博客函數
就知道給文章配表情包學習
在這裏,鄭重的回覆一下spa
我願意(╬◣д◢) 翻譯
這篇博客,咱們繼續圍繞着dataframe轉圈圈吧3d
首先從計算函數提及code
咱先聲明一個dataframe,方便後續操做cdn
import pandas as pd
df_dict = {
"boys":[10,20,30],
"girls":[20,40,60]
}
df = pd.DataFrame(df_dict)
print(df)
複製代碼
對於一個高手來講,從上帝視角對數據有一個基本的把握是最重要的blog
那麼咱們須要一個函數索引
describe
圖片
你只須要使用一下,就能獲得不少的信息哦~
來,看一下結果
boys girls
count 3.0 3.0
mean 20.0 40.0
std 10.0 20.0
min 10.0 20.0
25% 15.0 30.0
50% 20.0 40.0
75% 25.0 50.0
max 30.0 60.0
複製代碼
這不要啥有啥麼
只要你英文沒啥大問題,認識count,mean,std,min,max
恭喜你,上面的數據 你都能看懂
這上帝視角
數據盡收眼底
pandas神奇的地方即將出現
當你學會一個函數 同步你會學會好幾個
我拿count舉個栗子啊 爲何,拿着個舉例子
還不是由於它最簡單!
先看代碼,在講解
import pandas as pd
df_dict = {
"boys":[10,20,30],
"girls":[20,40,60]
}
df = pd.DataFrame(df_dict)
print(df.count(axis=0))
複製代碼
輸出的結果,請注意
boys 3
girls 3
dtype: int64
複製代碼
是個series
沒錯了
那麼,重點來了,我這個僞大佬要開課了
df.count()
函數,統計cells個數, 額,仍是大白話吧
就是統計行或者列的小格子個數
嗯,這麼說,容易懂
它有個參數,很是,很是,很是重要
之後會常常碰到
這個參數,就是axis,翻譯成中文,叫作軸
沒錯,就是座標軸的那個軸
默認值呢是0
0等於index 1等於columns
難度來了,這個地方很差記(由於,我老是搞錯 Σ(っ°Д°;)っ)
在嘗試大白話解釋一下df.count(axis=0)
的意思
統計每一列單元格(小格子)數量
咦?不太對啊
剛剛不是還說0等於index麼?
那df.count(axis=0)
,不該該統計行麼?咋還統計成列了呢?
解釋最後一次了哦
axis=0 這個參數表示爲每列生成計數
因此,列名有幾個,統計出來的結果就有幾個
這個很容易暈哦~
我以爲你應該暈了
哎~慢慢繞吧
同理axis=1就表示爲每行生成計數
啦
剛剛的數據有三行,那對應的確定生成三行嘍
小提示
axis='index' 等於 axis = 0
axis = 'columns' 等於 axis = 1
複製代碼
爲何要在這個地方叨叨這麼多呢
還不是由於下面這個圖
我相信,你應該對axis這個函數瞬間感興趣了
這徹底搞不定,無法用的節奏啊
難不成,每次都跟我同樣
先猜0,不對,在換成1
哈哈哈哈哈哈哈哈哈 (好像暴露了,我菜的本質了呢)
哈哈,這三個函數咱看一下,其實很是簡單的
import pandas as pd
df_dict = {
"boys":[10,20,30],
"girls":[20,40,60]
}
df = pd.DataFrame(df_dict,index=['class1','class2','class3'])
print(df.mean(axis=1))
複製代碼
上面是獲取值
記住,有值就有索引
而後再展現一段代碼
需求,咱們要獲取每列中最小值的索引
import pandas as pd
df_dict = {
"boys":[10,20,30],
"girls":[20,40,60]
}
df = pd.DataFrame(df_dict,index=['class1','class2','class3'])
print(df.mean(axis=1))
print(df.idxmin())
複製代碼
電腦面前的你,趕忙的吧,
你一試就知道結果了
還等什麼?
其餘的,像方差,求和,標準差,都去試試吧
你能夠滴!
T
來了在學習series的時候,咱們用了一個s.T 神奇的是啥效果也沒有
今天用dataframe在來試一下
import pandas as pd
df_dict = {
"boys":[10,20,30],
"girls":[20,40,60]
}
df = pd.DataFrame(df_dict,index=['class1','class2','class3'])
print(df)
print("x"*50)
print(df.T)
複製代碼
看到沒? 出現效果了
行索引,變成列索引 列索引,變成行索引
厲害,厲害
其實這個就是轉置
線性代數上線啦
下課!
話很少說,結束,開始展現公衆號