terrier索引結構

Terrier檢索平臺對文檔集索引後主要生成了四種索引文件,即文檔索引、直接索引、詞典、倒排索引,下面分別介紹這四種索引的格式。 下圖是我對索引文件數據結構的總結: 文檔索引(DocumentIndex) 文檔索引保存在data.document.fsarrayfile文件中,存儲了每個文檔的信息,包括文檔長度(docLength)、條目數(numEntries)和 指向相應直接索引 的指針。 指
相關文章
相關標籤/搜索