MapReduce經典案例-倒排索引

一、案例分析 1.倒排索引介紹 倒排索引是文檔檢索系統中最常用的數據結構,被廣泛應用於全文搜索引擎。倒排索引主要用來存儲某個單詞(或詞組)住一組文檔中的存儲位置的映射,提供了可以根據內容來查找文檔的方式,而不是根據文檔來確定內容,因此稱爲倒排索引(Inverted Index)。帶有倒排索引的文件稱爲倒排索引文件,簡稱倒排文件(Inverted File)。 通常情況下,倒排文件由一個單詞(或詞組
相關文章
相關標籤/搜索