聚類算法原理簡介

1,聚類概念 聚類涉及到數據點的分組。給定一組數據點,我們可以使用聚類算法將每個數據點劃分爲一個特定的組。理論上,同一組中的數據點應該具有相似的屬性和/或特徵,而不同組中的數據點應該具有高度不同的屬性和/或特徵。聚類是一種無監督學習的方法(沒有標籤),是許多領域中常用的統計數據分析技術有時候作爲監督學習中稀疏特徵的預處理,有時候可以作爲異常值檢測。應用場景:新聞聚類、用戶購買模式(交叉銷售)、圖像
相關文章
相關標籤/搜索