訓練集,驗證集,測試集

關鍵字:普通參數,超參數,訓練集,驗證集,測試集    很多機器學習過程實際上就是選擇模型,由於模型只是參數未知,所以就需要得到一個最優參數,使得模型可以比較準確的描述自變量到因變量的變化情況。對於模型的訓練和度量,就需要用到已知的數據集。     數據集一般分爲以下3種。如果已經有了一個大的標註數據集,那麼通過隨機抽樣獲得三種數據集,三者的比例爲8:1:1。如果有標註的話,也可以只隨機抽樣出訓練
相關文章
相關標籤/搜索