降維與度量學習——機器學習(周志華)

原文地址 降維與度量學習 樣本的特徵數稱爲維數(dimensionality),當維數非常大時,也就是現在所說的「維數災難」,具體表現在:在高維情形下,數據樣本將變得十分稀疏,因爲此時要滿足訓練樣本爲「密採樣」的總體樣本數目是一個觸不可及的天文數字,謂可遠觀而不可褻玩焉…訓練樣本的稀疏使得其代表總體分佈的能力大大減弱,從而消減了學習器的泛化能力;同時當維數很高時,計算距離也變得十分複雜,甚至連計算
相關文章
相關標籤/搜索