零基礎入門數據挖掘-建模調參

  調整數據類型,減少內存佔用,提高訓練效率 數據標籤呈現長尾分佈,使用線性迴歸,需要轉化成正態分佈 通過對便籤進行 log(x + 1) 變換,使之接近正太分佈 對比發現,log變換前後,預測值與實際值差異明顯變小了(左圖爲log變換前,右圖爲log變換後) 五折交叉驗證 升級版五折交叉驗證(考慮時間順序關係構造訓練集和驗證集) 學習率曲線和驗證曲線 針對線性迴歸模型,使用嵌入式特徵選擇優化 L
相關文章
相關標籤/搜索