聚類總結:各種聚類算法的分類、優缺點、適用場景總結

一.聚類的概念 1.定義 聚類指的是按照某個特定標準(如距離準則)把一個數據集分割成不同的類或簇,使得同一個簇內的數據對象的相似性儘可能大,同時不在同一個簇中的數據對象的差異性也儘可能地大。即聚類後同一類的數據儘可能聚集到一起,不同數據儘量分離。 (注:聚類方法是屬於無監督的分類方式。) 2.聚類的分類 聚類方法主要劃分爲五大類: (1)基於層次的聚類 原理:試圖在不同層次上對數據集進行劃分,從而
相關文章
相關標籤/搜索