Mahout系列之------Canopy算法

Canopy 算法,流程簡單,容易實現,一下是算法 (1)設樣本集合爲S,確定兩個閾值t1和t2,且t1>t2。 (2)任取一個樣本點p屬於S,作爲一個Canopy,記爲C,從S中移除p。 (3)計算S中所有點到p的距離dist (4)若dist<t1,則將相應點歸到C,作爲弱關聯。 (5)若dist<t2,則將相應點移出S,作爲強關聯。 (6)重複(2)~(5),直至S爲空。 上面的過程可以看出
相關文章
相關標籤/搜索