機器學習筆記(二)—— 判斷模型的好壞

一、 劃分訓練集和測試集 訓練集:用於訓練模型的集合 測試集:用於測試訓練模型的集合。 常見的數據集拆分方法: 1. 留出法 留出法(hold-out)直接將數據集D拆分成兩個互斥的集合,其中一個作爲訓練集S,另一個作爲測試集T。即D=S∪T,S∩T=∅。在S上訓練出模型後,用T來評估其測試誤差,作爲對泛化誤差的估計。 注意:(1)訓練/測試集的劃分要儘可能保持數據分佈的一致性,避免因數據劃分過程
相關文章
相關標籤/搜索