「達觀杯」文本智能處理挑戰賽⑥:網格搜索、交叉驗證與模型融合

數據競賽中提高成績主要有3個地方 特徵工程 調參 模型融合 本節介紹用網格搜索來調參,它主要是指嘗試我們關心的參數的所有可能組合。 交叉驗證是在特定數據集上對給定算法進行評估的一種方法,是一種評估泛化性能的統計學方法,它比單次劃分訓練集和測試集的方法更加穩定、全面。在交叉驗證中,數據被多次劃分,並且需要訓練多個模型。最常用的是k折交叉驗證(k-fold cross-validation)。 但它通
相關文章
相關標籤/搜索