數據分析與挖掘學習歷程3

異常值分析 1.簡單統計量分析 先做描述性統計,分析離羣點 2.3σ原則 如果數據服從正態分佈,則距離平均值3之外的值出現概率爲P<=0.003,爲極小概率事件 箱型圖分析 異常值通常被定義爲Ql-1.5IQR或大於Qu+1.5IQR的值 Ql稱爲下四分位數,表示全部觀察值中有四分之一數據比他小 Qu稱爲上四分位數,表示全部觀察值中有四分之一數據比他大 IQR稱爲四分位數間距,是Qu-Ql,爲樣本
相關文章
相關標籤/搜索