機器學習模型評估方法

1.訓練集測試集劃分方案 算法 a)留出法hold-outbootstrap 直接將原始數據集D劃分爲兩個互斥集合,其中一個做爲訓練集S,另一個做爲測試集T,其中D=S並T,S交T=空。在劃分的過程當中應該儘可能保持數據分佈一致,即S,T的分佈要和原始數據集一致,如原始數據集中正負樣本比例爲1:5,那麼在S和T中正負樣本比也應該爲1:5。通常採用分層抽樣的方案,即從正樣本中抽取1份作訓練集的正樣本
相關文章
相關標籤/搜索