《機器學習實戰》KMeans均值聚類算法

一、引言 聚類是一種無監督學習,對一些沒有標籤的數據進行分類。 二、K均值聚類算法 2.1 算法過程: 隨機確定K個初始點爲質心(簇個數k由用戶給定),計算數據集中每個點到每個質心的距離 本次採用的是歐式距離,然後將數據集中的每個點尋找距其最近的質心,分配到對應的簇中 完成後,每個簇的質心更新爲該簇所有點的平均值。 進行迭代,直到相鄰結果得到最終的質心誤差在允許範圍內。 2.2 對testSet.
相關文章
相關標籤/搜索