文件倒排索引算法及其hadoop實現

什麼是文件的倒排索引?java 簡單講就是一種搜索引擎的算法。過倒排索引,能夠根據單詞快速獲取包含這個單詞的文檔列表。倒排索引主要由兩個部分組成:「單詞」和對應出現的「倒排文件」。算法 詳細解釋有一篇博客說得挺好:http://blog.csdn.net/hguisu/article/details/7962350 apache MapReduce的設計思路 整個過程包含map、combiner、
相關文章
相關標籤/搜索