機器學習實戰--聚類

一 什麼是聚類? 在無監督學習中,訓練樣本的標記信息是未知的,目標是通過對無標記訓練樣本的學習來揭示數據的內在性質及規律,爲進一步的數據分析提供基礎。 聚類試圖將數據集中的樣本劃分爲活幹個通常是不想交(正交)的子集,每個子集稱爲一個簇。通過這樣的劃分每個簇可能對應於一些潛在的類別。這些類別對聚類算法而言事前是未知的。聚類的過程僅能自動形成簇機構,簇所對應的類別語義需由使用者來把握和命名。 聚類既能
相關文章
相關標籤/搜索