【特徵工程】連續數據特徵離散化的方法

離散化 背景 連續數據常常採用離散化處理以後再放入模型。離散化能夠理解爲提取特徵的過程,好比在LR模型,因爲是廣義線性模型表達能力有限,所以經過特徵離散化來了提升非線性學習能力web 主要方法 等距離散 取值範圍均勻劃成n等份,每份的間距相等svg 等頻離散 均勻分爲n等份,每分內包含的觀察點數相同學習 優化離散 大體有兩類方法: 1. 卡方檢驗方法:(統計樣本的實際觀測值與理論推斷值之間的偏離程
相關文章
相關標籤/搜索