(模式識別)特徵降維問題

(模式識別)特徵降維問題 降維的必要性 多重共線性--預測變量之間相互關聯。多重共線性會導致解空間的不穩定,從而可能導致結果的不連貫。 高維空間本身具有稀疏性。一維正態分佈有68%的值落於正負標準差之間,而在十維空間只有0.02%。 過多的變量會妨礙查找規律的建立。 僅在變量層面上分析可能會忽略變量之間的潛在聯繫。 降維的目的: 減少預測變量的個數 確保這些變量是相互獨立的 提供一個框架來解釋結果
相關文章
相關標籤/搜索