scala-MLlib官方文檔---spark.mllib package--clusteirng

時間 2020-08-12

標籤 scala mllib 官方文檔 spark.mllib spark package clusteirng 欄目 Scala 简体版

原文原文鏈接

5、Clustering 聚類是一個無監督的學習問題，咱們旨在基於類似性的概念將實體的子集彼此分組。聚類一般用於探索性分析和/或做爲分級監督學習管道的組成部分（在該學習管道中，針對每一個聚類訓練不一樣的分類器或迴歸模型）。web k-means K均值是最經常使用的聚類算法之一，它將數據點彙集成預約數量的聚類。 spark.mllib實現包括k-means ++方法的並行變體，稱爲kmeans |

>>阅读原文<<