機器學習系列-數據拆分和結果評價

1.數據集分類 機器學習中的數據分爲訓練數據集、驗證數據集和測試數據集。 通常,在訓練有監督的機器學習模型的時候,會將數據劃分爲訓練集、驗證集合測試集,劃分比例一般爲0.6:0.2:0.2。對原始數據進行三個集合的劃分,是爲了能夠選出效果(可以理解爲準確率)最好的、泛化能力最佳的模型。 訓練集(Training set) 作用是用來擬合模型,通過設置分類器的超參數,訓練分類模型。後續結合驗證集作用
相關文章
相關標籤/搜索