【機器學習】聚類算法介紹

K-MEANS算法 聚類概念: 無監督問題:我們手裏沒有標籤了 聚類:相似的東西分到一組 難點:如何評估,如何調參 kmeans基本概念: 要得到簇的個數,需要指定K值 質心:均值,即向量各維取平均即可 距離的度量:常用歐幾里得距離和餘弦相似度(先標準化) 優化目標: 優勢: 簡單,快速,適合常規數據集 劣勢: K值難確定 複雜度與樣本呈線性關係 很難發現任意形狀的簇 DBSCAN算法 基本概念:
相關文章
相關標籤/搜索