lucene初識

Lucene 簡介

Lucene 是一個基於 Java 的全文信息檢索工具包,它不是一個完整的搜索應用程序,而是爲你的應用程序提供索引和搜索功能。Lucene 目前是 Apache Jakarta 家族中的一個開源項目。也是目前最爲流行的基於 Java 開源全文檢索工具包。apache



Lucene 軟件包的發佈形式是一個 JAR 文件,下面咱們分析一下這個 JAR 文件裏面的主要的 JAVA 包,使讀者對之有個初步的瞭解。工具

Package: org.apache.lucene.documentspa

這個包提供了一些爲封裝要索引的文檔所須要的類,好比 Document, Field。這樣,每個文檔最終被封裝成了一個 Document 對象。orm

Package: org.apache.lucene.analysis對象

這個包主要功能是對文檔進行分詞,由於文檔在創建索引以前必需要進行分詞,因此這個包的做用能夠當作是爲創建索引作準備工做。索引

Package: org.apache.lucene.index文檔

這個包提供了一些類來協助建立索引以及對建立好的索引進行更新。這裏面有兩個基礎的類:IndexWriter 和 IndexReader,其中 IndexWriter 是用來建立索引並添加文檔到索引中的,IndexReader 是用來刪除索引中的文檔的。it

Package: org.apache.lucene.searchimport

這個包提供了對在創建好的索引上進行搜索所須要的類。好比 IndexSearcher 和 Hits, IndexSearcher 定義了在指定的索引上進行搜索的方法,Hits 用來保存搜索獲得的結果。基礎

相關文章
相關標籤/搜索