周志華機器學習筆記(一)

2 模型評估與選擇 2.2 評估方法 2.2.1留出法 留出法直接將數據集D劃分爲兩個互斥的集合,其中一個集合作爲訓練集S,另一個作爲測試集T。在S上訓練出模型後,用T來評估其測試誤差,作爲對泛化誤差的估計。 注意:訓練/測試集的劃分儘可能保持數據分佈的一致性,避免因數據劃分過程引入額外的偏差而對最終結果產生影響。常見做法是將大約2/3~4/5的樣本用於訓練,剩餘樣本用於測試 2.2.2 交叉驗證
相關文章
相關標籤/搜索