從NLP任務中文本向量的降維問題,引出LSH(Locality Sensitive Hash 局部敏感哈希)算法及其思想的討論...

1. 引言 - 近似近鄰搜索被提出所在的時代背景和挑戰 0x1:從NN(Neighbor Search)說起 ANN的前身技術是NN(Neighbor Search),簡單地說,最近鄰檢索就是根據數據的相似性,從數據集中尋找與目標數據最相似的項目,而這種相似性通常會被量化到空間上數據之間的距離,例如歐幾里得距離(Euclidean distance),NN認爲數據在空間中的距離越近,則數據之間的相
相關文章
相關標籤/搜索