Python數據分析學習筆記(6)數據規約實戰--以主成分分析PCA爲例

一、相關理論: 1、數據規約:產生更小且保持數據完整性的新數據集。意義在於降低無效、錯誤數據;降低存儲成本;少量且具有代表性的數據大幅加快,主要分爲以下兩類: ①屬性規約:屬性合併或刪除無關維,目標是尋找最小子集使子集概率分佈儘可能與原來相同。     常用方法: (1)合併屬性 將就屬性合併爲新屬性 {A1,A2,A3,B1,B2,C}——{A,B,C} (2)逐步向前選擇 從空集開始,逐個加入
相關文章
相關標籤/搜索