降維(一)維度災難與降維主要方法

降維 在很多機器學習問題中,訓練集中的每條數據經常伴隨着上千、甚至上萬個特徵。要處理這所有的特徵的話,不僅會讓訓練非常緩慢,還會極大增加搜尋良好解決方案的困難。這個問題就是我們常說的維度災難。 不過值得慶幸的是,在實際問題中,經常可以極大地減少特徵的數目,將棘手的問題轉變爲容易處理的問題。例如,以MNIST圖片數據集爲例:在圖片邊框附近的像素點基本都是白色,所以我們完全可以從訓練集中剔除掉這些像素
相關文章
相關標籤/搜索