在全部聚類算法中KMeans算是表面上最簡單的一種,沒有過多惱人的古希臘符號公式,沒有過度繁雜的公式嵌套。對於一個初學矩陣或者僅有向量概念的非專業人士的來講,不可不畏是一把踹門利器。這個世界上越是簡單的東西,其實越是複雜,尤爲在筆者將其改形成MapReduce時,發現並不是那麼容易一躍而過。雖然有現成的代碼供把玩,可是對於練手仍是值得一試。 算法
· 純理論一筆帶過 多線程
KMean的大體實現過程就是任意指定N個的質心,而後對全部星星進行遍歷,尋找與這個N個質心距離最近歐幾里得距離的星星,將其歸爲一類,再從這一類中從新計算N個質心座標屬性。直至這N個質心座標變化DELTA小至本身設定的閥值。架構
· 一些心得 oop
X Y 29 12 21 33 23 23 25 23 33 24 22 36 23 12 16 20 23 32 33 10 26 23 32 14 33 7 38 4 13 33 65 77 43 63 81 87 72 64 54 71 61 67 81 58 57 81 54 79 50 82 53 62 74 58 77 55 69 81 70 82 44 55 60 58