Python數據分析----數據探索

1. 數據質量分析 數據質量分析的主要任務是檢查原始數據中是否存在髒數據:缺失值、異常值、不一致值、重複數據和含有特殊符號的數據。數組 1.1. 缺失分析 1)缺失的緣由: 函數 有些信息沒法獲取或獲取的代價過大 有些信息是被遺漏 屬性值不存在 2)缺失的影響 數據挖掘建模將丟失大量有用信息 數據挖掘模型所表現出的不肯定性更加顯著,模型中蘊含的規律更難把握 包含空值的數據會使建模過程陷入混亂,致使
相關文章
相關標籤/搜索