數據清洗(三)------檢查數據邏輯錯誤

檢查數據邏輯錯誤

數據邏輯錯誤通常分兩種:(1)被調查者輸入的選項不符合要求。eg:最多3個選項的多選題,答題者選了4個選項。

                                            (2)錄入錯誤。eg:二分法的多選題錄入時,出現了0和1以外的數據。

檢查方法:if函數和or函數

IF(logical_test,value_if_true,value_if_false)

OR(logical1,logical2,logical3,.......)----至少一個參數爲真,就返回true

AND(logical1,logical2,logical3,.......)--所有參數都爲真時,才返回true

(一)用IF函數檢查第一類錯誤

有4道題,每道題有ABCDEFG個選項,每個選項被選中則爲1,否則爲0,既不爲0又不爲1的屬於錄入錯誤。



如上圖所示,在 I21單元格內輸入=IF(COUNTIF(B21:H21,"<>0")>3,"錯誤","正確")等式,在檢驗列的剩下單元格也輸入相應的等式。由結果可知,被調查者在答第2道題的時候輸入的選項不符合要求。


(二)用條件格式和OR函數標記錄入錯誤

開始---條件格式---突出顯示單元格規則---其他規則---使用公式確定要設置格式的單元格---在「爲符合此公式的值設置格式」文本框中輸入「=OR(B21=1,B21=0)=FALSE」



由上圖所示,錄入錯誤即被標記出來。