K-折交叉驗證算法

援引:深度學習 將數據集分成固定的訓練集和固定的測試集後,若測試集的誤差很小,這將是有問題的。一個小規模的測試集意味着平均測試誤差估計的統計不確定性,使得很難判斷算法A 是否比算法B 在給定的任務上做得更好。 當數據集有十萬計或者更多的樣本時,這不會是一個嚴重的問題。當數據集太小時,也有替代方法允許我們使用所有的樣本估計平均測試誤差,代價是增加了計算量。這些過程是基於在原始數據上隨機採樣或分離出的
相關文章
相關標籤/搜索