數據挖掘學習08 - 實驗：使用R評估kmeans聚類的最優K

時間 2021-01-07

原文原文鏈接

本文目的最近這幾天一直在研究如何評估Kmeans聚類算法中的最優K值。主要理論依據是《數據挖掘導論》8.5.5節中介紹的SSE和Silhouette Coefficient係數的方法評估最優K。現在記錄整個實驗過程，作爲備忘。不過，體驗過程中，由於R軟件使用的還不太熟練，實現過程中有些地方可能不準確，還請大牛指點。實驗步驟概述下載實驗數據，點擊這裏。取k值範圍，計算出SSE，並繪製出曲線圖

>>阅读原文<<