最核心的特徵工程方法-分箱算法

分箱算法簡介 先來說講什麼是分箱算法,根據字面意思就是把數據按照不一樣的規則分到不一樣的箱子裏。其實分箱是特徵工程的一種,能夠理解爲一種連續數據變爲離散數據的建模方式。算法   舉個直觀的例子,好比有一組連續數據,好比爲25,14,68,43,63。假設數據的分箱邏輯是大於50爲0,小於50爲1,那麼最終數據會變成1,1,0,1,0,數據就離散化了。固然分箱有不少方式,大體做用就是把連續數據按照必
相關文章
相關標籤/搜索