聚類算法(一)

本文主要介紹聚類算法的原理、聚類分析的兩個基本問題:性能度量和距離計算,聚類分析中類個數的確定方法與原則,以及進行聚類分析前的數據中心化和標準化變換處理。 一、概述 聚類(Clustering)是一種無監督學習(Unsupervised Learning),即訓練樣本的標記信息是未知的。聚類既可以通過對無標記訓練樣本的學習來揭示數據的內在性質及規律,找尋數據內在的分佈結構,也可以作爲分類等其他學習
相關文章
相關標籤/搜索