python數據探索

第三章 數據探索 3.1 數據質量分析 髒數據包括:缺失值;異常值;不一致的值;重複數據及含有特殊符號的數據; 1.缺失值處理 統計缺失率,缺失數 2.異常值處理 (1)簡單統計量分析 (2)3Q原則 正態分佈狀況下,小几率事件爲異常值 不服從正太分佈的,能夠用原離平均值多少倍標準差來分析 (3)箱線圖分析 使用describe()描述html import pandas as pd cater
相關文章
相關標籤/搜索