【機器學習課程-華盛頓大學】:4 聚類和檢索 4.2 LSH局部敏感哈希

kd-tree:在高維數據時很難處理,而且搜索難度高。   1、LSH是一種找到近似鄰居的方法。 比如以下這種情況,找不到真正的最近鄰。因爲我們只在要尋找的點所在的bin中找最近鄰。   2、3個挑戰: (1)分割線很難找 (2)質量函數很差時,很難解決:2個點離的很近,但被分到了2個bin中,很難解決 (3)計算量有時候很大:有時候1個bin中分的數據太多   3、提高效率:減少每次查詢的點數
相關文章
相關標籤/搜索