聚類分析Kmean

1、聚類的使用 1)事先不知道樣本的類別,甚至不知道需要得出的類別個數。 2)樣本類別之間有差異性,分類結果能很好地解釋預期現象。 3)一般用於數據探索,比如發現羣組和離羣點檢測,還可以作爲其他算法的預處理步驟。 2、樣本選擇: 很多教程都告訴我們基於劃分方法的聚類多適用於中等體量的數據集,但我們也不知道「中等」到底有多「中」。通常認爲記錄數量一般沒有限制,與實際應用有關,但樣本中記錄個數一般要大
相關文章
相關標籤/搜索