Python機器學習 聚類算法K-MEANS DBSCAN

聚類概念: 無監督問題:我們手裏沒有標籤了 難點:如何評估,如何調參 聚類:相似的東西分到一組   K-MEANS算法 基本概念: 要得到簇的個數,需要指定K值 距離的度量:常用歐幾里得距離和餘弦相似度(先標準化) 優化目標: 工作流程:        (1)從數據中隨機選擇k個對象(如三分類,K=3)作爲初始聚類中心;   (2)計算每個聚類對象(樣本)到聚類中心(隨機選擇的點)的距離來劃分;
相關文章
相關標籤/搜索