Information Retrieval 倒排索引 學習筆記

一,問題描述 在Shakespeare文集(有很多文檔Document)中,尋找哪個文檔包含了單詞「Brutus」和"Caesar",且不包含"Calpurnia"。這其實是一個查詢操作(Boolean Queries)。 在Unix中有個工具grep,它能線性掃描一篇文檔,然後找出某個單詞是否在該文檔中。因此,尋找哪篇文檔包含了「Brutus」和「Caesar」可以用grep來實現。但是:不包含
相關文章
相關標籤/搜索