Python數據分析之:進行數據分析的必要知識

1.常用的圖來分析數據 1.1 箱型圖:分析異常值 箱線圖的存在主要是用來分析異常值。 【異常值】 異常值也叫離羣點,異常值的存在經常會導致數據整體的偏差增大等問題。判斷異常值的標準有如下: ① 通過最大值和最小值: 例如:用戶的年齡不可能超過199歲,小孩的年齡不可能是-1歲,利用這些簡單的統計量分析可以判斷異常值 ② 通過 3 σ 3σ 3σ原則: 如果數據服從正態分佈,在 3 σ 3σ 3σ
相關文章
相關標籤/搜索