Lucene——索引過程分析Index

Lucene索引過程分爲3個主要操作步驟:將原始文檔轉換成文本、分析文本、將分析好的文本保存至索引中 一、提取文本和創建文檔 從 pdf、word等非純文本格式文件中,提取文本格式信息。建立起對應的,包含各個域的文檔後,就可以對這些文本信息進行分析。 使用 Tika框架實現 二、分析文檔 調用 IndexWriter對象的 addDocument方法,將數據傳遞給Lucene進行索引操作。 分析文
相關文章
相關標籤/搜索