一種面向高維數據的集成聚類算法

聚類集成已經成爲機器學習的研究熱點,它對原始數據集的多個聚類結果進行學習和集成,獲得一個能較好地反映數據集內在結構的數據劃分。不少學者的研究證實聚類集成能有效地提升聚類結果的準確性、魯棒性和穩定性。本文提出了一種面向高維數據的聚類集成算法。該方法針對高維數據的特色,先用分層抽樣的方法結合信息增益對每一個特徵簇選擇合適數量比較重要的特徵的生成新的具表明意義的數據子集,而後用基於連接的方法對數據子集上
相關文章
相關標籤/搜索