數據分析 第六篇:聚類的評估(簇數肯定和輪廓係數)和可視化

在實際的聚類應用中,一般使用k-均值和k-中心化算法來進行聚類分析,這兩種算法都須要輸入簇數,爲了保證聚類的質量,應該首先肯定最佳的簇數,並使用輪廓係數來評估聚類的結果。html 一,k-均值法肯定最佳的簇數 一般狀況下,使用肘方法(elbow)以肯定聚類的最佳的簇數,肘方法之因此是有效的,是基於如下觀察:增長簇數有助於下降每一個簇的簇內方差之和,給定k>0,計算簇內方差和var(k),繪製var
相關文章
相關標籤/搜索