數據清洗和轉換

數據清洗和轉換 實際生產環境中機器學習比較耗時的一部分 大部分的機器學習模型所處理的都是特徵,特徵通常是輸入變量所對應的可用於模型的 數值表示 大部分情況下 ,收集得到的數據需要經過預處理後才能夠爲算法所使用,預處理的操作 主要包括以下幾個部分: 數據過濾 處理數據缺失 處理可能的異常、錯誤或者異常值 合併多個數據源數據 數據彙總 對數據進行初步的預處理,需要將其轉換爲一種適合機器學習模型的表示形
相關文章
相關標籤/搜索