昨天,有個傢伙,留言給我說
嫌我很差好寫博客函數
就知道給文章配表情包學習
在這裏,鄭重的回覆一下.net
我願意(╬◣д◢)
翻譯
這篇博客,咱們繼續圍繞着dataframe轉圈圈吧3d
首先從計算函數提及code
咱先聲明一個dataframe,方便後續操做blog
import pandas as pd df_dict = { "boys":[10,20,30], "girls":[20,40,60] } df = pd.DataFrame(df_dict) print(df)
對於一個高手來講,從上帝視角對數據有一個基本的把握是最重要的索引
那麼咱們須要一個函數圖片
describe
get
你只須要使用一下,就能獲得不少的信息哦~
來,看一下結果
boys girls count 3.0 3.0 mean 20.0 40.0 std 10.0 20.0 min 10.0 20.0 25% 15.0 30.0 50% 20.0 40.0 75% 25.0 50.0 max 30.0 60.0
這不要啥有啥麼
只要你英文沒啥大問題,認識count,mean,std,min,max
恭喜你,上面的數據
你都能看懂
這上帝視角
數據盡收眼底
pandas神奇的地方即將出現
當你學會一個函數
同步你會學會好幾個
我拿count舉個栗子啊
爲何,拿着個舉例子
還不是由於它最簡單!
先看代碼,在講解
import pandas as pd df_dict = { "boys":[10,20,30], "girls":[20,40,60] } df = pd.DataFrame(df_dict) print(df.count(axis=0))
輸出的結果,請注意
boys 3 girls 3 dtype: int64
是個series
沒錯了
那麼,重點來了,我這個僞大佬要開課了
df.count()
函數,統計cells個數,
額,仍是大白話吧
就是統計行或者列的小格子個數
嗯,這麼說,容易懂
它有個參數,很是,很是,很是重要
之後會常常碰到
這個參數,就是axis,翻譯成中文,叫作軸
沒錯,就是座標軸的那個軸
默認值呢是0
0等於index
1等於columns
難度來了,這個地方很差記(由於,我老是搞錯 Σ(っ°Д°;)っ)
在嘗試大白話解釋一下df.count(axis=0)
的意思
統計每一列單元格(小格子)數量
咦?不太對啊
剛剛不是還說0等於index麼?
那df.count(axis=0)
,不該該統計行麼?咋還統計成列了呢?
解釋最後一次了哦
axis=0 這個參數表示爲每列生成計數
上面的紅框,叫作每列
因此,列名有幾個,統計出來的結果就有幾個
這個很容易暈哦~
我以爲你應該暈了
哎~慢慢繞吧
同理axis=1就表示爲每行生成計數
啦
剛剛的數據有三行,那對應的確定生成三行嘍
小提示
axis='index' 等於 axis = 0 axis = 'columns' 等於 axis = 1
爲何要在這個地方叨叨這麼多呢
還不是由於下面這個圖
看完這個圖,以後
我相信,你應該對axis這個函數瞬間感興趣了
這徹底搞不定,無法用的節奏啊
難不成,每次都跟我同樣
先猜0,不對,在換成1
哈哈哈哈哈哈哈哈哈
(好像暴露了,我菜的本質了呢)
哈哈,這三個函數咱看一下,其實很是簡單的
import pandas as pd df_dict = { "boys":[10,20,30], "girls":[20,40,60] } df = pd.DataFrame(df_dict,index=['class1','class2','class3']) print(df.mean(axis=1))
上面是獲取值
記住,有值就有索引
而後再展現一段代碼
需求,咱們要獲取每列中最小值的索引
import pandas as pd df_dict = { "boys":[10,20,30], "girls":[20,40,60] } df = pd.DataFrame(df_dict,index=['class1','class2','class3']) print(df.mean(axis=1)) print(df.idxmin())
電腦面前的你,趕忙的吧,
你一試就知道結果了
還等什麼?
其餘的,像方差,求和,標準差,都去試試吧
你能夠滴!
T
來了在學習series的時候,咱們用了一個s.T
神奇的是啥效果也沒有
今天用dataframe在來試一下
import pandas as pd df_dict = { "boys":[10,20,30], "girls":[20,40,60] } df = pd.DataFrame(df_dict,index=['class1','class2','class3']) print(df) print("x"*50) print(df.T)
看到沒?
出現效果了
行索引,變成列索引
列索引,變成行索引
厲害,厲害
其實這個就是轉置
線性代數上線啦
下課!
話很少說,結束,開始展現公衆號
還等什麼,關注吧~