學習Hadoop第十七課(倒排索引)

上節課我們一起學習了Combiner的理論知識,這節課我們來一起學習一下倒排索引,那麼首先我們來了解一下什麼是倒排索引,如下圖所示,我們可以看到表中有單詞ID,單詞還有倒排列表,倒排列表存放的是某個單詞在第幾篇文章中出現的次數,比如谷歌這個單詞在第一篇文章中出現了1次,第二篇文章中出現了1次,第三篇文章中出現了2次,第四、第五篇文章各出現1次。那麼倒排索引的用處是什麼呢?我們以搜索引擎爲例,像百度
相關文章
相關標籤/搜索