過擬合(定義、出現的原因4種、解決方案7種)

定義 定義:給定一個假設空間H,一個假設h屬於H,如果存在其他的假設h’屬於H,使得在訓練樣例上h的錯誤率比h’小,但在整個實例分佈上h’比h的錯誤率小,那麼就說假設h過度擬合訓練數據。 ———《Machine Learning》Tom M.Mitchell 出現過擬合的原因 1.  訓練集的數量級和模型的複雜度不匹配。訓練集的數量級要小於模型的複雜度; 2.  訓練集和測試集特徵分佈不一致; 3
相關文章
相關標籤/搜索