數據挖掘之聚類分析

聚類分析是在沒有給定劃分類別的狀況下,根據數據類似度進行樣本分組的一種方法。算法 與分類模型須要使用有類標記樣本構成的訓練數據不一樣,聚類模型能夠創建在無類標記的數據上,是一種非監督的學習算法。併發 聚類的輸入是一組未被標記的樣本,聚類根據數據自身的距離或類似度將它們劃分爲若干組,劃分的原則是組內距離最小化,而組間距離最大化。函數 聚類分析以前將數值大都爲0的變量和相關性較高的變量刪除掉。而後經過
相關文章
相關標籤/搜索