常用來劃分測試集和訓練集的劃分方法

數據集的劃分: 在機器學習算法中,我們通常將原始數據集劃分爲三個部分(劃分要儘可能保持數據分佈的一致性): (1)Training set(訓練集): 訓練模型 (2)Validation set(驗證集): 選擇模型 (3)Testing set(測試集): 評估模型 其中Validation set的作用是用來避免過擬合的。在訓練過程中,我們通常用它來確定一些超參數(例:根據Validatio
相關文章
相關標籤/搜索