搜索引擎索引

倒排索引幫助搜索引擎在海量網頁中快速找到包含用戶查詢詞的所有網頁。 基本概念 1.單詞文檔矩陣 如上圖示,是表達哪些文檔包含哪些單詞的概念模型。 打對勾的位置代表包含關係;從縱向即文檔維度看:每列代表文檔包含了哪些單詞,比如文檔1包含了詞彙1和4;從橫向即單詞維度看:每行代表單詞在哪些文檔中出現過,比如詞彙2在文檔2和3出現過。 而搜索引擎的索引就是實現單詞文檔矩陣的具體數據結構。可以有不同的方式
相關文章
相關標籤/搜索