機器學習算法原理系列篇15: 聚類算法

聚類算法不需要用戶提供數據的標籤,是最常用的一類無監督機器學習方式。 簡單來說,聚類算法就是把數據分組。好的聚類算法達到的效果就是,相同組的數據會展現相似的性質,而不同組的數據特徵分佈會不大相同。通常而言需要聚類的數據特徵繁多,因此數據處於高維空間,我們需要首先定義距離,從而比較不同數據點之間的距離。距離相近的數據就可能被劃分到同一個組。       上圖給出了一個簡單的聚類問題,我們如何通過身高
相關文章
相關標籤/搜索