MLlib 中的聚類和分類

1. 聚類和分類 (1)什麼是聚類 聚類( Clustering)指將數據對象分組成爲多個類或者簇( Cluster),它的目標是:在同一個簇中的對象之間具有較高的相似度,而不同簇中的對象差別較大。其實,聚類在 人們日常生活中是一種常見行爲,即所謂的「物以類聚,人以羣分」,其核心思想在於分組,人們不斷地改進聚類模式來學習如何區分各個事物和人。 (2)什麼是分類 數據倉庫、數據庫或者其他信息庫中有許
相關文章
相關標籤/搜索