Tinghua Data Mining 3

特徵選擇3d

男女身高blog


男女抽菸 先驗分佈io

熵 衡量系統的不肯定性im

屬性的價值 下降了不肯定性 下降的幅度越高越好d3

主成分分析數據

旋轉是的數據間的correlation消失掉db

Q是正交陣img

七長八短,長寬相關性很差,信息丟失了不少。標籤

線性判別分析co

兩種顏色投影重疊,分類問題就很尷尬,無法處理 PCA不考慮Label 是無監督的

有標籤的數據用LDA、

降維的時候保留類的區分信息

可分性

迄今爲止,都是二分類問題

相關文章
相關標籤/搜索