倒排索引原理和實現

關於倒排索引 搜索引擎通常檢索的場景是:給定幾個關鍵詞,找出包含關鍵詞的文檔。 怎麼快速找到包含某個關鍵詞的文檔就成爲搜索的關鍵。這裏我們藉助單詞——文檔矩陣模型, 通過這個模型我們可以很方便知道某篇文檔包含哪些關鍵詞,某個關鍵詞被哪些文檔所包含。 單詞-文檔矩陣的具體數據結構可以是倒排索引、簽名文件、後綴樹等。 倒排索引源於實際應用中需要根據屬性的值來查找記錄,lucene是基於倒排索引實現的。
相關文章
相關標籤/搜索