白話總結《特徵工程之連續變離散》

主要參考博客:http://www.sohu.com/a/211388625_670669 目前業務所用模型都需要把連續的特徵轉化爲離散值,特做總結如下: 1. Bucket 分桶: 把範圍較廣的連續值分桶 分桶的個數一般由特徵意義和經驗人爲設定,比如年齡可以根據小學,初中,高中,大學等分桶, 此處以日期舉例: 優勢: 連續性特徵拆分成一個四元素向量,那麼模型現在可以學習四個單獨的權重,與單個權重
相關文章
相關標籤/搜索