【機器學習必知必會】交叉驗證

前言 當我們根據數據訓練出一個機器學習模型時,我們希望它在新的數據上也保持較高的準備率,這就需要我們對學習到的不同模型有一個模型評估準則。 爲了評估模型的泛化性能(指模型在未知數據上的預測能力),防止模型落入「過擬合」的陷進。我們人爲地將原始數據劃分爲訓練集和測試集,前者用於訓練模型,後者用於評估模型的泛化性能。 訓練集、驗證集和測試集 在監督學習建模中,數據集常被劃分爲2~3組(驗證集有時候不出
相關文章
相關標籤/搜索