Lucence底層原理淺析

Lucence底層原理淺析 Lucence簡介 Lucence是全Java實現的,前幾年實現了開源,性能較高,而且支持分詞、各種查詢(正則、模糊、前綴)、關鍵詞高亮等。 Lucence整體步驟 生成文檔—>建索引庫—>解析查詢—>檢索並返回 (1)原始數據即待索引文件,經過Tokenizer進行分詞處理,去掉停用詞(如"a",「the」,「an」,「啊」,「了"等),英文單詞還需要Stemming
相關文章
相關標籤/搜索