臺灣大學林軒田《機器學習基石》學習筆記第5講——Training versus Testing

一、Recap and Preview 我們先來看一下基於統計學的機器學習流程圖: 該流程圖中,訓練樣本D和最終測試h的樣本都是來自同一個數據分佈,這是機器能夠學習的前提; 另外,訓練樣本D應該足夠大,且hypothesis set的個數是有限的,這樣根據霍夫丁不等式,纔不會出現BadData,保證Ein≈Eout,即有很好的泛化能力; 同時,通過訓練,得到使Ein最小的h,作爲模型最終的矩g,g
相關文章
相關標籤/搜索