機器學習學習筆記 第十九章 聚類算法-K-MEANS

聚類算法 聚類的概念: 主要用來處理無監督問題,因爲我們手上沒有標籤了,靠電腦自己進行分類 聚類是指把相似的東西分到一組 難點 如何評估呢(因爲沒有了標籤,難以對比正確與否,很多評估方法失效了) 如何調參呢 K-MEANS的概念 K是指要得到的簇的數量,如下圖所示應該要得到三個簇,K值需要我們自己指定 質心 其實是均值,如上圖中的小紅點,取向量各位的平均值 距離的度量 常常使用歐氏距離和預先相似度
相關文章
相關標籤/搜索