訓練集,測試集,驗證集、一些對機器學習術語的掌握

訓練集用於訓練模型,然後經過幾次迭代後使用測試集測試模型,要保證訓練集和測試集是分開的,不能在訓練集中混入測試數據。 但是儘管這樣,但是模型還是會在測試集中學習到東西導致過擬合的發生,也就是測試結果效果特別好。 所以選擇將數據集劃分成三個:訓練集、測試集、驗證集 樣本: 有標籤樣本:特徵+標籤 無標籤樣本 模型: 訓練時給出特徵和標籤,讓模型學習特徵並逐漸與標籤建立聯繫。 測試時不給出標籤,讓模型
相關文章
相關標籤/搜索