學習筆記(二)數據挖掘概念與技術

1中心趨勢度量:均值(mean)、中位數、衆數 截尾均值:丟掉高低極端值後的均值 加權算術均值(加權平均): 中位數(median)是有序數據的中間值,對於非對稱數據是數據中心更好的度量。 用插值法計算中位數的近似值:median=其中是中位數區間的下界,N是整個數據集中值的個數,是低於中位數區間的所有區間的頻率和,是中位數區間的頻率,而width是中位數區間的寬度。 衆數(mode):集合中出現
相關文章
相關標籤/搜索