使用複合鍵優化倒排索引

巧用複合鍵優化倒排索引程序 之前寫了一個倒排索引的程序,但是可以注意在到生成的索引文檔中,一個單詞對應的文檔並非是按照詞頻的大小進行排列的。這不是我們最想要的結果,我們希望對應的文檔按照詞頻的大小進行排列。 這裏我們使用複合鍵來完成對文檔的排序。 巧用複合鍵可以達到一些優化效果,比如說將多個細粒度的鍵值對合併爲一個處理度的鍵值對,這樣可以減小集羣中網絡的開銷。  比如: 可以優化爲:<a,<b:1
相關文章
相關標籤/搜索