k-折交叉驗證

人們發現用同一數據集,既進行訓練,又進行模型誤差估計,對誤差估計的很不準確,這就是所說的模型誤差估計的樂觀性。爲了克服這個問題,提出了交叉驗證。基本思想是將數據分爲兩部分,一部分數據用來模型的訓練,稱爲訓練集;另外一部分用於測試模型的誤差,稱爲驗證集。由於兩部分數據不同,估計得到的泛化誤差更接近真實的模型表現。數據量足夠的情況下,可以很好的估計真實的泛化誤差。但是實際中,往往只有有限的數據可用,需
相關文章
相關標籤/搜索