利用Minhash和LSH尋找相似的集合

問題背景 給出N個集合,找到相似的集合對,如何實現呢?直觀的方法是比較任意兩個集合。那麼可以十分精確的找到每一對相似的集合,但是時間複雜度是O(n2)。當N比較小時,比如K級,此算法可以在接受的時間範圍內完成,但是如果N變大時,比B級,甚至P級,那麼需要的時間是不能夠被接受的。比如N= 1B = 1,000,000,000。一臺計算機每秒可以比較1,000,000,000對集合是否相等。那麼大概需
相關文章
相關標籤/搜索