倒排索引

倒排索引是文檔檢索系統中最常見的數據結構,被廣泛的應用於搜索引擎。它是一種根據內容查找文檔的方式。由於不是根據文檔來找內容,而是根據進行了相反的操作,因此叫做倒排索引。 倒排索引的一個簡單結構如下圖所示:   單詞文檔列表       最常見的是使用詞頻作爲權重,即單詞在一個文檔中出現的次數。如圖所示,已知3個文檔。    則他們的索引文件爲   因此,當搜索條件爲「MapReduce」「is」「
相關文章
相關標籤/搜索