模型評估與選擇

時間 2019-12-08

標籤模型評估選擇简体版

原文原文鏈接

經驗偏差與過擬合

常見概念

偏差：學習器的實際預測輸出與樣本的真實輸出之間的差別算法

經驗偏差：學習器在訓練集上的偏差性能

泛化偏差：在新樣本上的偏差學習

過擬合：指學習時選擇的模型所包含的參數過多，以致於出現這一模型對已知數據預測得很好，但對未知數據預測得不好的現象測試

欠擬合：指對訓練樣本的通常性質還沒有學好.net

評估方法

留出法

定義：將數據集 D 劃分爲兩個互斥的集合，其中一個集合做爲訓練集 S，另外一個做爲測試集 T，即 $D = S \cup T, S \cap T = \varnothing$ .在 S 上訓練出模型後，用 T 來評估其測試偏差，做爲對泛化偏差的估計。3d

不一樣的劃分將致使不一樣的訓練/測試集，相應的，模型的評估結果也會有差異。所以，單次使用留出法獲得的估計結果每每不夠穩定可靠，在使用留出法時，通常要採用若干次隨機劃分、重複進行試驗評估後取平均值做爲留出法的評估結果。cdn

交叉驗證法

先將數據集 D 劃分紅 k 個大小類似的互斥子集，即 $D = D_1 \cup D_2 \cup ... \cup D_k ，D_i \cap D_j = \varnothing (i\neq j ).$ 而後，每次用 k - 1 個子集的並集做爲訓練集，餘下的那個子集做爲測試集；這樣就可得到 k 組訓練/測試集，從而可進行 k 次訓練和測試，最終返回這 k 個測試結果的均值。一般把這稱爲 k 折交叉驗證， k 的取值影響着交叉驗證評估結果的穩定性和保真性。將數據集 D 劃分爲 k 個子集存在多種劃分方式，爲減小因樣本劃分不一樣而引入的差異，k 折交叉驗證一般要隨機使用不一樣的劃分重複 p 次，最終的評估結果爲這 p 次 k 折交叉驗證結果的均值。blog

自助法

定義：給定包含 m 個樣本的數據集 D，咱們對它進行採樣產生數據集 $D^{'}$ ：每次隨機從 D 中挑選一個樣本，將其拷貝放入 $D^{'}$ ，而後再將該樣本放回初始數據集 D 中，使得該樣本在下次採樣時仍有可能被採樣到；這個過程重複執行 m 次後，咱們就獲得了包含 m 個樣本的數據集 $D^{'}$ ，這就是自助採樣的結果。it