極客學習——倒排索引、Analyzer分詞

倒排索引的核心組成 單詞詞典:記錄全部文檔的單詞,記錄單詞到倒排列表的關聯關係 倒排列表記錄了單詞對應的文檔組合,由倒排索引項組成 倒排索引項: 文檔ID 詞頻TF :該單詞在文檔中出現的次數,用於相關性評分 位置:單詞在文檔中分詞的位置,用於語句搜索 偏移:記錄單詞的開始結束位置,實現高亮顯示 elasticsearch的json文檔中的每一個字段,都有本身的倒排索引;能夠指定對某些字段不作索引
相關文章
相關標籤/搜索