[轉]solr入門

solr做爲nosql,和mysql等關係數據庫區別於,solr數據查詢功能簡單,作倒排索引, 查詢效率相對於mysql快.java

1,下載solr3.4.0mysql

2,solr+tomcat:git

1. 拷貝 apache-solr-3.4.0/dist/apache-solr-3.4.0.war至apache-tomcat-7.0.21/webapps/
   最好重命名爲solr.war,簡化網頁訪問路徑
2. 拷貝 apache-solr-3.4.0/example/solr 至 /home/hadooper/solr_home (或者任意一個你指定的Solr主目錄)
3. 修改tomcat/webapp/yourappname/web.xml文件,在文件末尾添加env-entry值
   或者修改 apache-tomcat-7.0.21/conf/web.xml, 指定solr主目錄
   在文件末尾(</web-app>以前)添加:
    <env-entry>
        <env-entry-name>solr/home</env-entry-name>
        <env-entry-value>/home/hadooper/solr_home/</env-entry-value>
        <env-entry-type>java.lang.String</env-entry-type>
    </env-entry>

3,solr 過濾查詢+like/not like查詢web

http://localhost:8983/solr/select/?q=3007WFP&version=2.2&start=0&rows=10&indent=on&fq=websitetype:[30%20TO%2039]
http://localhost:8983/solr/select/?q=3007WFP&version=2.2&start=0&rows=10&indent=on&fl=websitetype&fq=-websitetype:[30%20TO%2039]

4,solr and/not 查詢sql

NOT:http://localhost:8123/Search/s?hl=true&hlfl=title,content&rows=10&start=0&wt=xml&q=title:(廈門) OR content:(廈門) NOT websitetype:[30 TO 39]
AND:http://localhost:8123/Search/s?hl=true&hlfl=title,content&rows=10&start=0&wt=xml&q=title:(廈門) OR content:(廈門) AND websitetype:[30 TO 39]

5,http://www.solr.cc/數據庫

6,solr倒排表:http://www.tuicool.com/articles/URvmQfapache

--------------------------------------------------------------------------------------------------------tomcat

原理簡述說明:solr使用lucene,實質是對lucene的封裝,將其應用化;app

lucene索引過程:webapp

 a,文件文檔化:document;
 b,分詞處理:tokenizer;
  將文檔分詞一個個單獨的單詞;
  去除標點符號
  去除停詞()
c,語言處理:linguistic processor
  變小寫;
  詞根化:cars->car/drove->drive;這個過程叫stemming,lemmatization

  stemming: cars->car,solr6下面有個protwords.txt,用於屏蔽stemming操做,參考

  lemmatization: drove->drive

   注:搜索過程獲得的詞語一樣要作bc兩步
d,對3的詞語作建字典,作倒排表;

 

分詞:

solr6.0 自帶標準分詞,除此以外,通用中文分詞還有ik,hanlp;

ik下載:https://code.google.com/archive/p/ik-analyzer/downloads

但ik僅更新到2012版本,solr6可參考:http://blog.csdn.net/linzhiqiang0316/article/details/51554217

經過配置IKAnalyzer.cfg.xml,以及dict文件,可自行配置term和停詞

solrj更刪改查參考:https://cwiki.apache.org/confluence/display/solr/Using+SolrJ

字段區域更新:http://solr.pl/en/2012/07/09/solr-4-0-partial-documents-update/

相關文章
相關標籤/搜索