如何確保機器學習最重要的起始步驟"特徵工程"的步驟一致性?

大家好,我是爲人造的智能操碎了心的智能禪師。 關於特徵工程,業界有這麼一句話:數據和特徵決定了機器學習的上限,而模型和算法只是逼近這個上限。 機器學習模型需要數據來訓練,但是通常需要對這些數據進行預處理,以便在訓練模型時發揮作用。這種預處理,也就是我們熟知的 「特徵工程」,採用多種形式,例如:規範化和縮放數據,將分類值編碼爲數值,形成詞彙表,以及連續數值的分級。 特徵工程是指從原始數據轉換爲特徵向
相關文章
相關標籤/搜索