字節跳動數據挖掘算法工程師一面(記錄)

一、在作LR的時候,對連續數據作離散化處理的優點是什麼?算法 稀疏向量內積乘法運算速度快,計算結果方便存儲,容易scalable(擴展)。編程 離散化後的特徵對異常數據有很強的魯棒性:好比一個特徵是年齡>30是1,不然0。若是特徵沒有離散化,一個異常數據「年齡300歲」會給模型形成很大的干擾。網絡 邏輯迴歸屬於廣義線性模型,表達能力受限;單變量離散化爲N個後,每一個變量有單獨的權重,至關於爲模型引
相關文章
相關標籤/搜索