機器學習算法總結9:k-means聚類算法

無監督學習:訓練樣本的標記信息是未知的,目標是通過對無標記訓練樣本的學習來揭示數據的內在性質及規律,爲進一步的數據分析提供基礎。 聚類是典型無監督學習任務,它試圖將數據集中的樣本劃分爲若干個通常是不相交的子集,每個子集稱爲一個簇。 距離度量:通過距離來定義相似度度量,距離越大,相似度越小。最常用的距離度量是閔可夫斯基距離,其中,當p=2時,稱爲歐氏距離;當p=1時,稱爲曼哈頓距離。詳見我的博客:機
相關文章
相關標籤/搜索