海量數據處理-字典樹和倒排索引

海量數據處理-字典樹和倒排索引 海量數據處理我們已經提到過分而治之mapreduce,和排序相關的專題,今天我們來看一下之前也有簡單介紹過的字典樹和倒排索引。 倒排索引 倒排索引是一種索引方法,常用在搜索引擎中,這個數據結構是根據屬性值來確定記錄的位置。對於一批文檔,我們的屬性值就是關鍵字,對應值是包含該屬性的文檔的ID或者文化的位置。 例如: T0 = {a,b,c} T1 = {a,d} T2
相關文章
相關標籤/搜索