Lucene的分析過程

回顧倒排索引的構建 收集待建索引的原文檔(Document) 將原文檔傳給詞條化工具(Tokenizer)進行文本詞條化 將第二步得到的詞條(Token)傳給語言分析工具(Linguistic modules)進行語言學預處理,得到詞項(Term) 將得到的詞項(Term)傳給索引組件(Indexer),建立倒排索引 注:詳細文檔->倒排索引的理論過程見詞項詞典及倒排記錄表   分析操作的使用場景
相關文章
相關標籤/搜索