交叉驗證:評估模型表現

註明:本文章所有代碼均來自scikit-learn官方網站 在實際情況中,如果一個模型要上線,數據分析員需要反覆調試模型,以防止模型僅在已知數據集的表現較好,在未知數據集上的表現較差。即要確保模型的泛化能力,它指機器學習對新鮮樣本的適應能力。只有保證模型的泛化能力,模型的構建纔有意義。因此,交叉驗證在整個建模流程中顯得尤爲重要。 如果不對數據集進行處理,而僅是用含有標籤的已知數據訓練模型會得到很高
相關文章
相關標籤/搜索