深度學習之正則化系列(2):數據集加強(數據增廣)

讓機器學習模型泛化得更好的最好辦法是使用更多的數據進行訓練。固然,在實踐中,咱們擁有的數據量是頗有限的。解決這個問題的一種方法是建立假數據並添加到訓練集中。對於一些機器學習任務,建立新的假數據至關簡單。對分類來講這種方法是最簡單的。分類器須要一個複雜的高維輸入 x,並用單個類別標識 y 歸納 x。這意味着分類面臨的一個主要任務是要對各類各樣的變換保持不變。咱們能夠輕易經過轉換訓練集中的 x 來生成
相關文章
相關標籤/搜索