倒排索引的原理

倒排索引的原理: 有倒排索引確定有正向索引,先說一下什麼是正向索引:web ​ 通俗的來講:正向索引就是經過文檔去找關鍵詞,倒排索引就是經過關鍵詞去找文檔;svg 正向索引: ​ 假設有5個文件,每一個文件都對應一個文件ID,文件的內容被表示爲一系列關鍵詞的集合。例如「文檔1」通過分詞,提取了20個關鍵詞,而後記錄每一個關鍵詞在文檔中的出現次數和出現位置。搜索引擎 ​ 獲得正向索引的結構以下:xm
相關文章
相關標籤/搜索