搜索引擎————倒排索引

1.倒排索引基本概念 文檔(Document):通常搜索引擎的處理對象是互聯網網頁,而文檔表明以文本形式存在的存儲對象,比網頁來講更加普遍,好比Word,PDF,html,XML等不一樣格式的文件均可以稱之爲文檔。再好比一封郵件,一條短信,一條微博也能夠稱之爲文檔。 文檔集合(Document Collection):由若干文檔構成的集合稱之爲文檔集合。 文檔編號(Document ID):在搜索
相關文章
相關標籤/搜索