機器學習入門筆記(二):數據的預處理

機器學習本身要通過對大量的數據進行訓練進而生成模型。數據的質量就顯得很重要,但我們有時拿到的數據的質量並不是那麼的高,所以我們要對數據進行一些預處理,提高數據的質量。這些預處理包括採樣、歸一化、去噪和數據過濾等操作。 1、採樣(sampling) 如果要處理的數據量很大,我們只需要從中選取部分樣本進行訓練即可,以達到節省計算量提高實驗效率的目的,採樣一般包括以下幾種: 1、systematic s
相關文章
相關標籤/搜索