機器學習中訓練集和測試集比例

在搜索機器學習相關信息偶然看到一篇文章的圖片。瞭解不同數據情況下的數據配比。這裏記錄下: 當數據量比較小時,可以使用 7 :3 訓練數據和測試數據 (西瓜書中描述 常見的做法是將大約 2/3 ~ 4/5 的樣本數據用於訓練,剩餘樣本用於測試) 或者 6: 2 : 2 訓練數據,驗證數據和測試數據 當數據量非常大時,可以使用 98 : 1 : 1 訓練數據,驗證數據和測試數據   這個配比和 孫高飛
相關文章
相關標籤/搜索