西瓜書模型評估與選擇

經驗誤差和過擬合 一句話概括就是訓練集的樣本要儘可能好,儘可能準確,機器纔會學到好的經驗,這樣預測才準確。 過擬合就是加入了一些無關痛癢的特徵,比如上圖,是不是樹葉跟有沒有鋸齒沒有關係,所以有無鋸齒不能作爲特徵;欠擬合指的是特徵太少導致無法準確預測。 評估方法 不管什麼評估方法,測試樣本與訓練樣本要儘可能不同。 留出法 留出法簡言之就是將已有數據集的80%作爲訓練集,20%作爲測試集,通常是這麼分
相關文章
相關標籤/搜索