基於hadoop搜索引擎實踐——生成倒排表文件(四)

2.3 建立倒排表文件 (下面原理引用劉鵬hadoop實戰)     在分析完分詞,Rank值得計算等問題的解決方案之後,就可以設計相應的MapReduce算法,來建立倒排表,計算,保存Rank和Position等附屬信息。     首先定義倒排表存儲信息格式,這是算法的輸出目標,也是查詢程序從倒排表中獲取信息的接口。本系統倒排表的存儲格式定義如下:     (1)倒排表文件(INVERTED_I
相關文章
相關標籤/搜索