K-means聚類最優k值的選取

最近做了一個數據挖掘的項目,挖掘過程中用到了K-means聚類方法,但是由於根據行業經驗確定的聚類數過多並且並不一定是我們獲取到數據的真實聚類數,所以,我們希望能從數據自身出發去確定真實的聚類數,也就是對數據而言的最佳聚類數。爲此,我查閱了大量資料和博客資源,總結出主流的確定聚類數k的方法有以下兩類。 1.手肘法 1.1 理論 手肘法的核心指標是SSE(sum of the squared err
相關文章
相關標籤/搜索