機器學習備忘錄之組合特徵

高維組合特徵的處理 組合特徵是指把一階離散特徵兩兩組合,構成高階組合特徵。 這裏的維度就是2*2=4。可是如果考用戶ID,那麼參數規模非常大。此時考慮對用戶ID用低維向量表示。 組合特徵 簡單地將特徵兩兩組合容易存在參數過多、過擬合等問題。上面提出的是一種降維的思考,下面說的是基於決策樹的組合特徵尋找方法。 先建立決策樹,根據決策樹進行特徵組合,可以減少無用的特徵組合方式。 參考: 百面機器學習
相關文章
相關標籤/搜索