聚類的性能度量以及常見的聚類類型

「聚類」(clustering)算法是「無監督學習」算法中研究最多、應用最廣的算法,它試圖將數據集中的樣本劃分爲若干個通常是不相交的子集,每個子集稱爲一個「簇」(cluster) 因爲聚類是在未標註樣本上的分類算法,所以不像之前我們介紹的其它算法一樣,我們可以直觀的知道訓練出來的模型的好壞,即我們不能通過比對測試樣本的預測結果和真實預測結果誤差值來近似泛化誤差。 一 、 聚類結果好壞的評估指標:性
相關文章
相關標籤/搜索