solr做爲nosql,和mysql等關係數據庫區別於,solr數據查詢功能簡單,作倒排索引, 查詢效率相對於mysql快.java
1,下載solr3.4.0mysql
2,solr+tomcat:git
1. 拷貝 apache-solr-3.4.0/dist/apache-solr-3.4.0.war至apache-tomcat-7.0.21/webapps/ 最好重命名爲solr.war,簡化網頁訪問路徑 2. 拷貝 apache-solr-3.4.0/example/solr 至 /home/hadooper/solr_home (或者任意一個你指定的Solr主目錄) 3. 修改tomcat/webapp/yourappname/web.xml文件,在文件末尾添加env-entry值 或者修改 apache-tomcat-7.0.21/conf/web.xml, 指定solr主目錄 在文件末尾(</web-app>以前)添加: <env-entry> <env-entry-name>solr/home</env-entry-name> <env-entry-value>/home/hadooper/solr_home/</env-entry-value> <env-entry-type>java.lang.String</env-entry-type> </env-entry>
3,solr 過濾查詢+like/not like查詢web
http://localhost:8983/solr/select/?q=3007WFP&version=2.2&start=0&rows=10&indent=on&fq=websitetype:[30%20TO%2039] http://localhost:8983/solr/select/?q=3007WFP&version=2.2&start=0&rows=10&indent=on&fl=websitetype&fq=-websitetype:[30%20TO%2039]
4,solr and/not 查詢sql
NOT:http://localhost:8123/Search/s?hl=true&hlfl=title,content&rows=10&start=0&wt=xml&q=title:(廈門) OR content:(廈門) NOT websitetype:[30 TO 39] AND:http://localhost:8123/Search/s?hl=true&hlfl=title,content&rows=10&start=0&wt=xml&q=title:(廈門) OR content:(廈門) AND websitetype:[30 TO 39]
5,http://www.solr.cc/數據庫
6,solr倒排表:http://www.tuicool.com/articles/URvmQfapache
--------------------------------------------------------------------------------------------------------tomcat
原理簡述說明:solr使用lucene,實質是對lucene的封裝,將其應用化;app
lucene索引過程:webapp
a,文件文檔化:document;
b,分詞處理:tokenizer;
將文檔分詞一個個單獨的單詞;
去除標點符號
去除停詞()
c,語言處理:linguistic processor
變小寫;
詞根化:cars->car/drove->drive;這個過程叫stemming,lemmatization
stemming: cars->car,solr6下面有個protwords.txt,用於屏蔽stemming操做,參考
lemmatization: drove->drive
注:搜索過程獲得的詞語一樣要作bc兩步
d,對3的詞語作建字典,作倒排表;
分詞:
solr6.0 自帶標準分詞,除此以外,通用中文分詞還有ik,hanlp;
ik下載:https://code.google.com/archive/p/ik-analyzer/downloads
但ik僅更新到2012版本,solr6可參考:http://blog.csdn.net/linzhiqiang0316/article/details/51554217
經過配置IKAnalyzer.cfg.xml,以及dict文件,可自行配置term和停詞
solrj更刪改查參考:https://cwiki.apache.org/confluence/display/solr/Using+SolrJ
字段區域更新:http://solr.pl/en/2012/07/09/solr-4-0-partial-documents-update/