高維向量快速檢索方法Locality Sensitive Hashing之一漢明空間和歐式空間實現

1 高維向量檢索問題 高維向量檢索主要解決由數據維數增加所引發檢索速度急劇下降的的問題。高維空間中數據的特點主要包括以下三個方面: (1) 稀疏性。隨着維度增長,數據在空間分佈的稀疏性增強; (2) 空空間現象。對於服從正態分佈的數據集,當維數大約增加到10時,只有不到1%的數據點分佈在中心附近; (3) 維度效應。隨着維數的增加,對索引的維護效率急劇下降,並且高維空間中數據點之間的距離接近於相等
相關文章
相關標籤/搜索