Coursera臺大機器學習課程筆記7 -- Noise and Error

時間 2019-11-12

標籤 coursera 臺大機器學習課程筆記 noise error 简体版

原文原文鏈接

本章重點: 簡單的論證了即便有Noise，機器依然能夠學習，VC Dimension對泛化依然起做用；介紹了一些評價Model效果的Error Measurement方法。算法

一論證即便有Noisy，VC Dimension依然有效；機器學習

下圖展現了主要思想，之前的數據集是肯定的（Deterministic），如今加了Noisy變成了分佈函數了，即對每一個一x，y出現的機率是P(y|x)。能夠這麼理解，機率表示的是對事件肯定的程度，之前肯定性的數據集是函數

P(y|x) = 1, for y = f(x) 學習

p(y|x) = 0, for y != f(x), 優化

加入了Noisy，便不是了，有必定的機率例如0.7是應該出現的值，0.3則爲犯錯的機率，即出現了不應出現的值。這即是加入Noisy的模型，只不過增長了機率分佈（其實之前也是，只不過是1和0罷了），只要y是p(y|x)取值的，就能夠認爲之前證實機器能夠學習的方法依然奏效，VC Dimension有限便可推斷Ein和Eout一致。spa