2018年8月份學習使用solr,當時下載的版本是solr7.5,寫這篇博文的時候是2019年3月份,solr此時已經出到了8.0版本。一個大版本的變遷確定有不少的改動,暫時還未研究就不贅述了。web
此篇博客只是記述一下當時對solr的使用方面研究。shell
solr下載地址:http://www.apache.org/dyn/closer.lua/lucene/solr/8.0.0數據庫
1、Luceneapache
在瞭解solr以前,先了解一下Lucene,Lucene是一個全文檢索的工具包,本質上是一個jar包,它沒法單獨在web容器中運行,可是你能夠把它導入到某個項目裏進行開發使用。固然如今solr已經幫你整好了,不建議這麼用。瀏覽器
Lucene進行全文檢索的結構圖以下服務器
1)採集數據app
從不一樣的源進行數據收集,例如數據庫,web端等。框架
數據庫:其餘系統存儲在數據庫中的數據webapp
web端:直接從web端錄入的數據工具
2)建立索引
數據採集完成後,Lucene會將採集到的全部數據建立索引,並將索引存儲在索引庫中
3)用戶查詢
用戶在web端,輸入索引關鍵詞,SearchIndex會根據關鍵詞在索引庫中進行索引查找
4)返回結果
SearchIndex查找到結果後返回給用戶
2、solr
solr是創建在Lucene基礎上的一個項目包,它能夠在Tomcat等web容器中直接運行,同時提供全文檢索服務。
可是,solr7.5是能夠直接運行的,不須要再像某個版本(我也不知道哪一個版本)以前須要將solr打包發佈到Tomcat才能運行使用。
1.solr下載
solr下載地址:http://www.apache.org/dyn/closer.lua/lucene/solr/
2.solr包功能介紹
下載solr包後解壓,包內目錄以及各自功能以下:
solr和solr.cmd:分別用於Linux和Windows系統,根據所選參數不一樣而控制Solr的啓動和中止
post:提供了一個用於發佈內容的命令行接口工具。支持導入JSON,XML和CSV,也能夠導入HTML,PDF,Microsoft Office格式(如MS Word),純文本等等。
solr.in.sh和solr.in.cmd:分別用於Linux和Windows系統的屬性文件
install_solr_services.sh:用於Linux系統將Solr做爲服務安裝
analysis-extras: 包含一些文本分析組件及其依賴
clustering:包含一個用於集羣搜索結果的引擎
dataimporthandler:把數據從數據庫或其它數據源導入到solr
extraction:整合了Apache Tika,Tika是用於解析一些富文本(諸如Word,PDF)的框架
langid:檢測將要索引的數據的語言
map-reduce:包含一些工具用於Solr和Hadoop Map Reduce協同工做
morphlines-core:包含Kite Morphlines,它用於構建、改變基於Hadoop進行ETL(extract、transfer、load)的流式處理程序
uima:包含用於整合Apache UIMA(文本元數據提取的框架)類庫
velocity:包含基於Velocity模板的簡單的搜索UI框架
exampledocs:這是一系列簡單的CSV,XML和JSON文件,能夠bin/post在首次使用Solr時使用
example-DIH:此目錄包含一些DataImport Handler(DIH)示例,可幫助您開始在數據庫,電子郵件服務器甚至Atom訂閱源中導入結構化內容。每一個示例將索引不一樣的數據集
files:該files目錄爲您可能在本地存儲的文檔(例如Word或PDF)提供基本的搜索UI
films:該films目錄包含一組關於電影的強大數據,包括三種格式:CSV,XML和JSON
contexts:這個文件包含了solr Web應用程序的Jetty Web應用的部署的配置文件
etc:主要就是一些Jetty的配置文件和示例SSL密鑰庫
lib:Jetty和其餘第三方的jar包
logs:Solr的日誌文件
resources:Jetty-logging和log4j的屬性配置文件
solr:新建的core或Collection的默認保存目錄,裏面必需要包含solr.xml文件
configsets:包含solr的配置文件
solr-webapp:包含solr服務器使用的文件;不要在此目錄中編輯文件(solr不是JavaWeb應用程序)
3.solr啓動
打開solr的bin目錄,shift+鼠標右鍵,「在此處打開powershell窗口」
輸入.\solr start
成功啓動後,在瀏覽器中訪問以下地址:
http://localhost:8983
4.solr具體參數配置
講道理,有點多,參照下面這個博客便可。
https://blog.csdn.net/bskfnvjtlyzmv867/article/details/80940089