關於訓練集、驗證集、測試集及數據不同時的情況

定義 訓練集用來擬合參數,驗證集用來查看參數的好壞,測試集在完成後測試置信度確保不會出問題。 劃分 傳統的分法是把數據集分成訓練集(70%)和測試集(30%),或者在需要交叉驗證集時分爲:訓練集(60%)、交叉驗證集(20%)、測試集(20%)。 但是現在是大數據時代,假設你的數據量大於100萬,那麼可以分成訓練集(98%)、交叉驗證集(1%)、測試集(1%)。因爲10000個數據已經具有普遍性了
相關文章
相關標籤/搜索