數據挖掘筆記(3)——聚類、離羣點分析

聚類 基本概念 聚類:       將對象分紅類似的類,聚類中 一個樣本可屬於多個類別算法 特徵:       不考慮數據的類標號,而是經過聚類產生新類標號網絡 評價:         最大化類內類似性(similarity),最小化類間類似性。類似性須要定義,做爲聚類的標準數據結構 數據挖掘的要求         可解釋性  函數         發現任意形狀的聚類大數據         處理不
相關文章
相關標籤/搜索