【數據清洗】數據清洗流程及經驗

預處理階段 預處理階段主要做兩件事情: 一是將數據導入處理工具。 二是看數據。包含兩個部分:一是看元數據,包括字段解釋、數據來源、代碼表等等一切描述數據的信息;二是抽取一部分數據,對數據本身有一個直觀的瞭解,並且初步發現一些問題,爲之後的處理做準備。 第一步:缺失值清洗 四個步驟: 1、確定缺失值範圍:對每個字段都計算其缺失值比例,然後按照缺失比例和字段重要性,分別制定策略。 2、去除不需要的字段
相關文章
相關標籤/搜索