Apache Lucene全文檢索

Lucene4.0的官網文檔:http://lucene.apache.org/core/4_0_0/core/overview-summary.htmlhtml

1、什麼是lucene

        Lucene是一套用於全文檢索和搜尋的開源程式庫是全文檢索的框架而不是產品(不像百度不一樣), lucene其實就作兩種工做:一入一出。所謂入是寫入,即將你提供的源(本質是字符串)寫入索引或者將其從索引中刪除;所謂出是讀出,即向用戶提供全文搜索服務,讓用戶能夠經過關鍵詞定位源。數據庫

        百科是這樣說的:Lucene是apache軟件基金會4 jakarta項目組的一個子項目,是一個開放源代碼的全文檢索引擎工具包,即它不是一個完整的全文檢索引擎,而是一個全文檢索引擎的架構,提供了完整的查詢引擎和索引引擎,部分文本分析引擎(英文與德文兩種西方語言)。Lucene的目的是爲軟件開發人員提供一個簡單易用的工具包,以方便的在目標系統中實現全文檢索的功能,或者是以此爲基礎創建起完整的全文檢索引擎。apache

lucene能作什麼架構

  

要回答這個問題,框架

先要了解工具

lucene搜索引擎

的本質。spa

實際上開放源代碼

lucenehtm

的功能很單一,

說到

底,

就是你給它若干個字符串,

而後它爲你提供一個全文搜索服務,

告訴你你要

搜索的關鍵詞出如今哪裏。

知道了這個本質,

你就能夠發揮想象作任何符合這個

條件的事情了。

你能夠把站內新聞都索引了,

作個資料庫;

你能夠把一個數據庫

表的若干個字段索引發來,

那就不用再擔憂由於「%like%」而鎖表了;

你也能夠

寫個本身的搜索引擎„„ 

相關文章
相關標籤/搜索