Algorithm:SimHash算法+倒排索引

一、SimHash算法 1、SimHash算法五個步驟 2、抽屜原理 圖中隨機的五個點(x,y),其中x和y均非奇即偶, 原理:其中,至少有兩個點肯定有屬於同一個類別比如(奇數,偶數),兩點加起來除以2,因爲奇數相加/2、偶數相加/2都是整數,中間的即爲格子點。只有當x1、x2(或y1、y2)屬於不同類型的時候,比如(奇數+偶數)不能夠除以2。所以,要從圖中五個點中找到同類型的點即可,而點的選取非
相關文章
相關標籤/搜索