[R][源碼]利用交叉驗證選擇最優聚簇數目

交叉驗證主要用於建模應用中,即在給定的建模樣本中,拿出大部分樣本進行訓練,留小部分樣本在剛建立的模型上進行測試。在運行kmeans等聚類算法時需要設定聚類數目,但聚類數目一般難以預測,交叉驗證可以解決這一問題。 一、          數據 選取R語言自帶的iris數據集,共3個聚類。數據共150個,每個樣本有4個特徵。由於數據帶有標號,故刪去Species列。 二、          實驗過程、
相關文章
相關標籤/搜索