Hadoop倒排索引(附帶完整代碼)

「倒排索引」是文檔檢索系統中最常用的數據結構,被廣泛地應用於全文搜索引擎。它主要是用來存儲某個單詞(或詞組)在一個文檔或一組文檔中的存儲位置的映射,即提供了一種根據內容來查找文檔的方式。由於不是根據文檔來確定文檔所包含的內容,而是進行相反的操作,因而稱爲倒排索引(Inverted Index) 1、實例描述 通常情況下,倒排索引由一個單詞(或詞組)以及相關的文檔列表組成,文檔列表中的文檔或者是標識
相關文章
相關標籤/搜索