模型的欠擬合與過擬合

使用訓練集去訓練模型,參數的選擇是依據最小化訓練誤差,加上訓練集和測試集一般不是獨立同分布,所以會有distribution dfift,出現過擬合或者欠擬合。 過擬合 過度依賴訓練數據,是的模型在訓練集上方差高,低偏差。 對上面一句話的理解: 1.訓練數據少,無法估計整個數據集的分佈 2.模型過於複雜,參數量遠多於訓練集數 還有一種理解是,在進行線性迴歸的時候,數據是線性可分的,決策邊界的參數會
相關文章
相關標籤/搜索