局部敏感哈希(Locality Sensitive Hashing)和MinHash介紹與實例

在實際應用中,我們所面對的數據是海量的,並且有着很高的維度。在對數據的各種操作中,查詢操作是最常見的一種,這裏的查詢是指輸入一個數據,查找與其相似的數據,那麼怎樣快速地從海量高維數據中,找到與某個數據最相似的數據,成爲了一個難點和問題。 低維的小數據集,可通過線性查找來解決,但如果是對一個海量的高維數據集採用線性查找的話,時間代價非常大,因此,爲了解決該問題,我們需要採用一些類似索引的技術來加快查
相關文章
相關標籤/搜索