二分K-均值聚類

K-均值算法算法可以實現收斂,但是存在一個問題是,K-均值算法會收斂到局部最優解而不是全局最優。 一種用於度量聚類效果的指標是SSE(sum of Squared Error,誤差平方和)。SSE值越小表示數據點越接近它們的質心,聚類效果也就越好。應爲誤差取了平方,因此更加重視那些遠離中心的點。一種肯定可以降低SSE值的方法是增加簇的個數,但這違背了聚類的目標。聚類的目標是在簇數目不變的情況下提高
相關文章
相關標籤/搜索