43-爲什麼要訓練數據集與測試數據集

爲什麼要訓練數據集與測試數據集?   在上一篇博客主要學習了過擬合和欠擬合的概念。在後面的學習中慢慢就會發現機器學習中主要處理的是過擬合問題。   現在我們仔細觀察一下在上一篇博客最後得到的過擬合的曲線。   我們說它之所以過擬合,是因爲雖然我們學習到的這個曲線使得我們整個樣本使用這個曲線進行預測的誤差變小了,但是如果有一個新的樣本的話,比如下圖紫色的點對應的 x x x 座標大概是 2.5 左右
相關文章
相關標籤/搜索