聚類的定義和2個基本問題

無監督學習中,訓練樣本的信息是未知的,目標是通過對無標記訓練樣本的學習來揭示數據的內在性質及規律,爲進一步的數據分析提供基礎。 應用最廣也是研究最多的是-----聚類 聚類試圖將數據集中的樣本劃分爲若干個通常是不相交的子集,每個子集稱爲一個「簇」。聚類過程只能形成簇結構,而簇對應的概念語義需要由使用者來把握和命名。聚類既可以作爲一個單獨過程用來尋找數據內部的分佈結構,也可以作爲分類等其他學習任務的
相關文章
相關標籤/搜索