模式識別與機器學習筆記2018.8.23

模型選擇   在最⼤似然⽅法中,由於過擬合現象,模型在訓練集上的表現並不能很好地表示模型對於未知數據的預測能⼒。如果數據量很⼤,那麼模型選擇很簡單。使⽤⼀部分可得到的數據,可以訓練出⼀系列的模型,也可以得到某個給定模型的⼀系列複雜度的參數值。之後在獨⽴數據上(有時被稱爲驗證集)⽐較它們,選擇預測表現最好的模型即可。如果模型的設計使⽤有限規模的數據集迭代很多次,那麼對於驗證數據會發⽣⼀定程度的過擬合
相關文章
相關標籤/搜索