機器學習算法原理系列篇15: 聚類算法

聚類算法不須要用戶提供數據的標籤,是最經常使用的一類無監督機器學習方式。 簡單來講,聚類算法就是把數據分組。好的聚類算法達到的效果就是,相同組的數據會展示類似的性質,而不一樣組的數據特徵分佈會不大相同。一般而言須要聚類的數據特徵繁多,所以數據處於高維空間,咱們須要首先定義距離,從而比較不一樣數據點之間的距離。距離相近的數據就可能被劃分到同一個組。算法       上圖給出了一個簡單的聚類問題,咱們
相關文章
相關標籤/搜索