k-means聚類算法過程與原理

k-means算法(k-均值聚類算法)是一種基本的已知聚類類別數的劃分算法。它是很典型的基於距離的聚類算法,採用距離作爲相似性的評價指標,即認爲兩個對象的距離越近,其相似度就越大。該算法認爲簇是由距離靠近的對象組成的,因此把得到緊湊且獨立的簇作爲最終目標。它是使用歐氏距離度量的(簡單理解就是兩點間直線距離,歐氏距離只是將這個距離定義更加規範化,擴展到N維而已)。它可以處理大數據集,且高效。它的輸入
相關文章
相關標籤/搜索