數據探索簡介——質量分析、特徵分析

此處參考《python數據分析和挖掘實戰》這本書python 數據質量分析:數組 主要是對異常值的分析:函數 一、3σ原則:若是數據符合正態分佈,那麼數據異常定義在一組測定值與平均值的誤差超過3倍標準差的值。在正態分佈的假設下,距離平均值3σ以外的值出現的機率爲P(|x-μ|>3σ)≤0.003,屬於極個別的小几率事件。但面對不服從正態分佈的數據,應該怎麼辦呢?spa 二、箱型圖法:該方法具備很大
相關文章
相關標籤/搜索