正排索引(forward index)與倒排索引(inverted index)

一、正排索引(前向索引) 正排索引也稱爲"前向索引"。它是創建倒排索引的基礎,具有以下字段。 (1)LocalId字段(表中簡稱"Lid"):表示一個文檔的局部編號。 (2)WordId字段:表示文檔分詞後的編號,也可稱爲"索引詞編號"。 (3)NHits字段:表示某個索引詞在文檔中出現的次數。 (4)HitList變長字段:表示某個索引詞在文檔中出現的位置,即相對於正文的偏移量。 由於一篇文章中
相關文章
相關標籤/搜索