初步理解機器學習評估(一)

評估方法: 留出法: 將數據集劃分爲兩個互斥集合,保持數據分佈的一致性,訓練/測試樣本比例通常爲2:1~4:1 交叉驗證法: 將數據集分層採樣劃分爲k個大小相似的互斥子集,每次用k-1個自己的丙級作爲訓練集,餘下的子集作爲測試集,最終返回k個測試結果的均值,k通常取10.爲了減小誤差,一般需要重複p次 留一法: 將交叉驗證法中的k = m(m是數據集中樣本的數量),這樣顯然有利有弊,結果相對準確,
相關文章
相關標籤/搜索