聚類算法之DBSCAN算法之二:高維數據剪枝應用NQ-DBSCAN

一、經典DBSCAN的不足 1.由於「維度災難」問題,應用高維數據效果不佳 2.運行時間在尋找每個點的最近鄰和密度計算,複雜度是O(n2)。當d>=3時,由於BCP等數學問題出現,時間複雜度會急劇上升到Ω(n的四分之三次方)。 二、DBSCAN在高維數據的改進 目前的研究有Grid-based和approx等方向,基於Grid-based結構的有Fast-DBSCAN,時間複雜度最壞是O(n*lo
相關文章
相關標籤/搜索