pandas.Series.value_counts

pandas.Series.value_countsapp

 

Series.value_counts(normalize=Falsesort=Trueascending=Falsebins=Nonedropna=True)spa

功能:返回包含惟一值計數的對象。結果對象將按降序排列,以便第一個元素是最常出現的元素。 不包括默認的NA值。code

參數normalize : boolean, default False             若是爲True,則返回的對象將包含惟一值的相對頻率。orm

   sort : boolean, default True                        按值排序對象

   ascending : boolean, default False            按升序排序blog

   bins : integer, optional                                 而不是數值計算,把它們分紅半開放的箱子,一個方便的pd.cut,只適用於數字數據排序

   dropna : boolean, default True                   不包括NaN的數量。pandas

返回:計數:Seriseio

 

  • Series 狀況下class

1 import numpy as np 2 import pandas as pd 3 from pandas import DataFrame 4 from pandas import Series 5 ss = Series(['Tokyo', 'Nagoya', 'Nagoya', 'Osaka', 'Tokyo', 'Tokyo']) 6 ss.value_counts()   #value_counts 直接用來計算series裏面相同數據出現的頻率
Tokyo     3 Nagoya 2 Osaka 1 dtype: int64
  • DataFrame 狀況下
1 import numpy as np 2 import pandas as pd 3 from pandas import DataFrame 4 from pandas import Series 5 df=DataFrame({'a':['Tokyo','Osaka','Nagoya','Osaka','Tokyo','Tokyo'],'b':['Osaka','Osaka','Osaka','Tokyo','Tokyo','Tokyo']})       #DataFrame用來輸入兩列數據,同時value_counts將每列中相同的數據頻率計算出來
6 print(df)
df:
 a b 0 Tokyo Osaka 1 Osaka Osaka 2 Nagoya Osaka 3 Osaka Tokyo 4 Tokyo Tokyo 5   Tokyo  Tokyo
1 df.apply(pd.value_counts) 2  a b 3 Nagoya    1    NaN           #在b列中meiynagoya,所以是用NaN 表示。
4 Osaka    2    3.0
5 Tokyo    3    3.0
相關文章
相關標籤/搜索