MapReduce--倒排索引

文檔倒排算法簡介 Inverted Index(倒排索引)是目前幾乎全部支持全文檢索的搜索引擎都要依賴的一個數據結構。基於索引結構,給出一個詞(term),能取得含有這個term的文檔列表(the list of documents) Web Search中的問題主要分爲三部分:web crawling(gathering web content) ,網頁爬蟲,收集數據 indexing(cons
相關文章
相關標籤/搜索