scala-MLlib官方文檔---spark.mllib package--clusteirng

5、Clustering 聚類是一個無監督的學習問題,咱們旨在基於類似性的概念將實體的子集彼此分組。聚類一般用於探索性分析和/或做爲分級監督學習管道的組成部分(在該學習管道中,針對每一個聚類訓練不一樣的分類器或迴歸模型)。web k-means K均值是最經常使用的聚類算法之一,它將數據點彙集成預約數量的聚類。 spark.mllib實現包括k-means ++方法的並行變體,稱爲kmeans |
相關文章
相關標籤/搜索