機器學習課程筆記---聚類

應用 評價指標 距離 k-means算法 前提要選取k個點 重心點不變了就可以。 存在的問題 1、初始點 2、k,從1開始試,慢慢增加,看趨勢 聚類之前需要做的事 !!!一定要歸一化,不同維度的值統一到一個範圍中。 以及均值中心化。 2、k-means++ 這裏的概率就是用輪盤賭算法 對於數值型的,可以算距離;對於離散的屬性,怎麼算距離? K-prototype 爲了防止分類距離對整體距離的影響
相關文章
相關標籤/搜索