solr7.5--win10--部署使用

2018年8月份學習使用solr,當時下載的版本是solr7.5,寫這篇博文的時候是2019年3月份,solr此時已經出到了8.0版本。一個大版本的變遷確定有不少的改動,暫時還未研究就不贅述了。web

此篇博客只是記述一下當時對solr的使用方面研究。shell

solr下載地址:http://www.apache.org/dyn/closer.lua/lucene/solr/8.0.0數據庫

1、Luceneapache

在瞭解solr以前,先了解一下Lucene,Lucene是一個全文檢索的工具包,本質上是一個jar包,它沒法單獨在web容器中運行,可是你能夠把它導入到某個項目裏進行開發使用。固然如今solr已經幫你整好了,不建議這麼用。瀏覽器

Lucene進行全文檢索的結構圖以下服務器

  1)採集數據app

    從不一樣的源進行數據收集,例如數據庫,web端等。框架

    數據庫:其餘系統存儲在數據庫中的數據webapp

    web端:直接從web端錄入的數據工具

  2)建立索引

    數據採集完成後,Lucene會將採集到的全部數據建立索引,並將索引存儲在索引庫中

  3)用戶查詢

    用戶在web端,輸入索引關鍵詞,SearchIndex會根據關鍵詞在索引庫中進行索引查找

  4)返回結果

    SearchIndex查找到結果後返回給用戶

2、solr

solr是創建在Lucene基礎上的一個項目包,它能夠在Tomcat等web容器中直接運行,同時提供全文檢索服務。

可是,solr7.5是能夠直接運行的,不須要再像某個版本(我也不知道哪一個版本)以前須要將solr打包發佈到Tomcat才能運行使用。

1.solr下載

  solr下載地址:http://www.apache.org/dyn/closer.lua/lucene/solr/

2.solr包功能介紹

下載solr包後解壓,包內目錄以及各自功能以下:

 

  • bin:包括一些使用Solr的重要腳本

       solr和solr.cmd:分別用於Linux和Windows系統,根據所選參數不一樣而控制Solr的啓動和中止
    post:提供了一個用於發佈內容的命令行接口工具。支持導入JSON,XML和CSV,也能夠導入HTML,PDF,Microsoft Office格式(如MS Word),純文本等等。
    solr.in.sh和solr.in.cmd:分別用於Linux和Windows系統的屬性文件
    install_solr_services.sh:用於Linux系統將Solr做爲服務安裝

  • contrib:包含一些solr的一些插件或擴展

    analysis-extras: 包含一些文本分析組件及其依賴
    clustering:包含一個用於集羣搜索結果的引擎
    dataimporthandler:把數據從數據庫或其它數據源導入到solr
    extraction:整合了Apache Tika,Tika是用於解析一些富文本(諸如Word,PDF)的框架
      langid:檢測將要索引的數據的語言
      map-reduce:包含一些工具用於Solr和Hadoop Map Reduce協同工做
      morphlines-core:包含Kite Morphlines,它用於構建、改變基於Hadoop進行ETL(extract、transfer、load)的流式處理程序
      uima:包含用於整合Apache UIMA(文本元數據提取的框架)類庫
      velocity:包含基於Velocity模板的簡單的搜索UI框架

  • dist:包含主要的Solr的jar文件
  • docs:文檔
  • example:包含一些展現solr功能的例子

       exampledocs:這是一系列簡單的CSV,XML和JSON文件,能夠bin/post在首次使用Solr時使用
       example-DIH:此目錄包含一些DataImport Handler(DIH)示例,可幫助您開始在數據庫,電子郵件服務器甚至Atom訂閱源中導入結構化內容。每一個示例將索引不一樣的數據集
       files:該files目錄爲您可能在本地存儲的文檔(例如Word或PDF)提供基本的搜索UI
       films:該films目錄包含一組關於電影的強大數據,包括三種格式:CSV,XML和JSON

  • licenses:包含全部的solr所用到的第三方庫的許可證
  • server:solr應用程序的核心,包含了運行Solr實例而安裝好的Jetty servlet容器。

       contexts:這個文件包含了solr Web應用程序的Jetty Web應用的部署的配置文件
       etc:主要就是一些Jetty的配置文件和示例SSL密鑰庫
       lib:Jetty和其餘第三方的jar包
       logs:Solr的日誌文件
       resources:Jetty-logging和log4j的屬性配置文件
       solr:新建的core或Collection的默認保存目錄,裏面必需要包含solr.xml文件
       configsets:包含solr的配置文件
       solr-webapp:包含solr服務器使用的文件;不要在此目錄中編輯文件(solr不是JavaWeb應用程序)

3.solr啓動

  打開solr的bin目錄,shift+鼠標右鍵,「在此處打開powershell窗口」

  

  輸入.\solr start

  

  成功啓動後,在瀏覽器中訪問以下地址:

  http://localhost:8983

  

 

4.solr具體參數配置

  講道理,有點多,參照下面這個博客便可。

  https://blog.csdn.net/bskfnvjtlyzmv867/article/details/80940089

相關文章
相關標籤/搜索