全文索引 Solr

(一)概念介紹linux

  1 分詞: 把一串文字分割成多個關鍵詞,也叫關鍵字.數據庫

  2 倒敘索引: 根據詞來找文檔 ,而普通索引是在文檔中找詞,因此效率很低.apache

  

 

(二) Lucene引入服務器

  Luceneapache軟件基金會的一個項目,是一個開放源代碼的全文檢索引擎工具包,在Java開發環境裏Lucene是一個成熟的免費開源工具。就其自己而言,Lucene是當前以及最近幾年最受歡迎的免費Java信息檢索程序庫。工具

  缺點:性能

  1. 效率過低
  2. 若是商品修改了,則須要同步索引文件.
  3. 若是商品新增了,則須要從新遍歷從新索引.
  4. 從新生成索引文件的時間較長.

 

(三) Solr介紹 (底層用的是Lucene)優化

  同類型產品: ElasticSearch搜索引擎

 

   (1) Solr是一個獨立的企業級搜索應用服務器,它對外提供相似於Web-serviceAPI接口。用戶能夠經過http請求,向搜索引擎服務器提交必定格式的XML文件,生成索引;也能夠經過Http Get操做提出查找請求,並獲得XML格式的返回結果.spa

  基於Lucene的全文搜索服務器。同時對其進行了擴展,提供了比Lucene更爲豐富的查詢語言,同時實現了可配置、可擴展並對查詢性能進行了優化,而且提供了一個完善的功能管理界面,是一款很是優秀的全文搜索引擎。開放源代碼

  使用 HttpSolrClient 進行遠程調用

 

  特色:

  1. solr能夠根據數據庫表自動生成索引文件.

  2. Solr能夠動態的按期自動更新索引(對更新的數據進行索引的修改)

  (2) 安裝

  1. Solr5.0以上版本要求jdk必須是1.8
  2. 將Solr壓縮包上傳到linux服務器中
  3. tar -xzvf 壓縮包名.tgz 進行解壓
  4. 進入bin目錄   使用命令   sh solr start 啓動solr
  5. 進入 http://服務器IP:8983 查看頁面,有頁面就成功了.

 

 (四)Solr與Lucene ,ikAnalyzer的關係

  

   管理界面以下

  

 

 


 

      

        之前歌詞裏的安河橋

             如今這裏的安河橋

相關文章
相關標籤/搜索