盒馬嘮機器學習之聚類算法

        聚類是數據挖掘中的概念,就是按照某個特定標準(如距離)把一個數據集分割成不同的類或簇,使得同一個簇內的數據對象的相似性儘可能大,同時不在同一個簇中的數據對象的差異性也儘可能地大。也即聚類後同一類的數據儘可能聚集到一起,不同類數據儘量分離。         對於聚類算法有兩難點,一是如何評價這個數據聚類也就是分蔟分得比較好,因爲是無監督的學習你不知道這個數據該分成幾類,而且類間成員是
相關文章
相關標籤/搜索