機器學習中訓練集和測試集比例

時間 2021-07-10

原文原文鏈接

在搜索機器學習相關信息偶然看到一篇文章的圖片。瞭解不同數據情況下的數據配比。這裏記錄下：當數據量比較小時，可以使用 7 ：3 訓練數據和測試數據 (西瓜書中描述常見的做法是將大約 2/3 ~ 4/5 的樣本數據用於訓練，剩餘樣本用於測試）或者 6： 2 : 2 訓練數據，驗證數據和測試數據當數據量非常大時，可以使用 98 : 1 : 1 訓練數據，驗證數據和測試數據這個配比和孫高飛