《Python數據分析與挖掘實戰》筆記(三):數據探索

1.數據質量分析 主要任務是檢查原始數據中是否存在髒數據,包括缺失值,異常值,不一致值,重複數據及特殊符號數據 缺失值,包括記錄缺失和記錄的某字段缺失等 產生緣由:沒法獲取、遺漏、屬性值不存在; 影響:有用信息缺少、不肯定性加劇、不可靠 處理:刪除、補全、不處理python 異常值,不合常理的數據,剔除可消除不良影響,分析可進行改進。異常值分析也稱離羣點分析。 經常使用的分析方法:簡單統計量分析(
相關文章
相關標籤/搜索