數據挖掘學習08 - 實驗:使用R評估kmeans聚類的最優K

本文目的 最近這幾天一直在研究如何評估Kmeans聚類算法中的最優K值。主要理論依據是《數據挖掘導論》8.5.5節中介紹的SSE和Silhouette Coefficient係數的方法評估最優K。現在記錄整個實驗過程,作爲備忘。不過,體驗過程中,由於R軟件使用的還不太熟練,實現過程中有些地方可能不準確,還請大牛指點。 實驗步驟概述 下載實驗數據,點擊這裏。 取k值範圍,計算出SSE,並繪製出曲線圖
相關文章
相關標籤/搜索