機器學習——聚類算法(clustering)

1、什麼是聚類? 通俗地講,聚類就是將不帶任何標籤的數據分成不同的組,是一種典型的無監督機器學習算法,聚類的難點:難以評估和調參。用兩張圖來理解分類和聚類的區別: 分類: 聚類: 2、K-means聚類 k-means算法是經典的聚類算法之一,在不帶標籤的多維數據集中尋找確定數量的簇。以k爲參數,把n個對象分成k個簇,使簇內具有較高的相似度,而簇間的相似度較低。 幾個重要的基本概念: K值:需要得
相關文章
相關標籤/搜索