信息檢索——倒排索引和布爾查詢

  線性掃描 詞項-文檔關聯 倒排索引 查詢處理AND 布爾查詢 自由文本查詢 查詢優化     舉例:查找《莎士比亞》中的人名 1 AND 2 but NOT 3   線性掃描grepping: 從頭到尾閱讀該全集,對每部劇本都留心是否包含1和2不包含3 缺點: 太慢 不靈活 無法排序   詞項-文檔關聯   缺點: 太大了 而且99.8%的元素都爲0   更好的方法是隻記錄原始矩陣中1的位置
相關文章
相關標籤/搜索