【機器學習課程-華盛頓大學】:4 聚類和檢索 4.6 聚類總結、分層聚類(分裂/成團)

一、總結 1、最近鄰搜索 (1)1NN (2)KNN TF-IDF,距離(歐氏距離,cosine),歸一化,暴力搜索複雜度 (3)KD-trees 缺點:不易實現;高維特徵難以實現 (4)LSH局部敏感哈希   2、k-means和MapReduce   3、混合高斯模型和EM k-means不能解決的:   4、LDA 吉布斯採樣   5、總結 二、分層聚類 優點:不需要選擇k值;可視化聚類結構
相關文章
相關標籤/搜索