數據科學家需要了解的5大聚類算法

聚類是一種涉及數據點分組的機器學習技術。給定一個數據點集,則可利用聚類算法將每個數據點分類到一個特定的組中。理論上,同一組數據點具有相似的性質或(和)特徵,不同組數據點具有高度不同的性質或(和)特徵。聚類屬於無監督學習,也是在很多領域中使用的統計數據分析的一種常用技術。本文將介紹常見的5大聚類算法。 K-Means算法 K-Means算法可能是最知名的聚類算法,該算法在代碼中很容易理解和實現。  
相關文章
相關標籤/搜索