R語言數據清洗與規整-迴歸模型爲例

數據清洗和規整是進行數據分析的前提條件,數據的清洗和規整通常會花費比進行數據分析更多的時間,正所謂「清洗一小時,分析五秒鐘」。 數據清洗和規整要依據實際數據的特徵進行,其包括缺失值和冗餘值的處理、數據重歸類、字符類型轉換等。這裏將使用「狗熊會」的基礎案例 「高考填報志願,你選好了嗎?」的數據進行介紹。該案例用於預測高校錄取分數線的相關影響因素,因變量爲x2015年平均線。 數據下載鏈接:http:
相關文章
相關標籤/搜索