4.2 數據集劃分-機器學習筆記-斯坦福吳恩達教授

數據集劃分 測試集 在線性迴歸的章節中,我們已經知道,僅僅具備一個很小的訓練誤差並不能保證我們的預測函數就是優秀的,因爲這種「優秀」僅僅體現在了對於已知的訓練樣本的假設上,而無法保證見到新的樣本時候還能做出足夠好的預測,過擬合就是當中的典型例子: 因此,預測準不準應當反映在對於新樣本的泛化(generalize)能力。我們考慮將數據集劃分爲: 訓練集:70% 測試集:30% 在對數據集進行訓練集和
相關文章
相關標籤/搜索