調整超參數:決定模型是「金子」還是「垃圾」!

數據清洗以後,你也許會困惑應該從哪裏開始建模。一般情況下它的下一步應該是特徵選擇,但特徵工程和模型訓練是相互影響的。好的特徵選擇可以使模型得到好的效果,而不同的模型又對數據有不同的要求。 因此,特徵工程和模型訓練是兩個不可分割的部分。由於模型的選擇會對特徵的選擇造成影響,因此,在特徵工程開始前,至少應該嘗試訓練一些可能的模型,查看當前的特徵是否適合可能的模型。如下圖是建模流程的循環,特徵工程和訓練
相關文章
相關標籤/搜索