機器學習入門——正則化

問題引入 當預測函數的項次數過高時,算法爲了降低代價,也就是差異,會跑出一條畸形的曲線。 雖然這條畸形的曲線完美的擬合了所有的數據點,但是顯然這樣一條曲線並不具有可推廣性、泛化性。對於以後給出的數據也不能準確的預測。這種情況稱爲擬合過度。 一般在數據量較小,而特徵值較多的情況下,過度擬合發生的概念較高。 正則化 爲了在保留較小的高次項的基礎上,解決過度擬合,我們需要進行正則化。 我們對於原有的代價
相關文章
相關標籤/搜索