solr+tomcat+nutch 整合

進入hadoop目錄,拷貝apache-solr-4.8.1.tgz,解壓縮java

tar-zxvf apache-solr-4.8.1.tgzweb

mv apache-solr-4.8.1 solrapache

cp -rf /home/hadoop/solr/dist/solr-4.8.1.war /usr/local/tomcat/webappsvim

mv solr-4.8.1.war solr.war瀏覽器

#啓動tomcat自動解壓tomcat

mkdir /home/hadoop/solr/solrhomeapp

mkdir /home/hadoop/solr/solrindexwebapp

cp -rf  /home/hadoop/solr/example/solr/*  /home/hadoop/solr/solrhomeide

vim /home/hadoop/solr/solrhome/collection1/conf/solrconfig.xmloop

把這幾個配置註釋掉,暫時用過不到。      

<!--

  <lib dir="../../../contrib/extraction/lib" regex=".*\.jar" />

  <lib dir="../../../dist/" regex="solr-cell-\d.*\.jar" />

 

  <lib dir="../../../contrib/clustering/lib/" regex=".*\.jar" />

  <lib dir="../../../dist/" regex="solr-clustering-\d.*\.jar" />

 

  <lib dir="../../../contrib/langid/lib/" regex=".*\.jar" />

  <lib dir="../../../dist/" regex="solr-langid-\d.*\.jar" />

 

  <lib dir="../../../contrib/velocity/lib" regex=".*\.jar" />

  <lib dir="../../../dist/" regex="solr-velocity-\d.*\.jar" />

-->

 

一樣是這個文件指定你的索引文件存在什麼地方的  

<dataDir>${solr.data.dir:}</dataDir>

/home/hadoop/solr/solrindex           #個人索引目錄

<dataDir>${solr.data.dir:/home/hadoop/solr/solrindex}</dataDir> 

 

vim /usr/local/tomcat/conf/Catalina/localhost/solr.xml

沒有手工建立建立solr.xml文件,文件內容以下:

<Context docBase="/usr/local/tomcat/webapps/solr.war" debug="0" crossContext="true" >

<Environment name="solr/home" type="java.lang.String" value="/home/hadoop/solr/solrhome" override="true" />

</Context>

 

vim /usr/local/tomcat/conf/server.xml

添加編碼方式,修改後以下<Connector port="8080" URIEncoding="UTF-8" #其它不變

 

啓動tomcat解壓solr.war 生成solr文件

vim /usr/local/tomcat/webapps/solr/WEB-INF/web.xml

 

<env-entry>

       <env-entry-name>solr/home</env-entry-name>

       <env-entry-value>/home/hadoop/solr/solrhome</env-entry-value>

       <env-entry-type>java.lang.String</env-entry-type>

    </env-entry>

 

這時候咱們啓動會報錯,說找不到一些類,這些類是log4j相關的,記日誌用的。

須要的jar包以下:

從/solr-4.7.0/example/lib/ext複製全部的jar到tomcat/lib下,並複製solr-4.7.0\example\resources\log4j.properties到tomcat/lib下

從新啓動tomcat,瀏覽器進入:http://localhost:8080/solr,便進入了solr的管理界面了

nutch+solr

cp schema.xml /newzqpic1/nutch/solr/example/solr/collection1/conf

(1)覆蓋solr的schema.xml文件。(對於solr4,應該使用schema-solr4.xml)

cp /usr/search/apache-nutch-2.3/conf/schema.xml /usr/search/solr-4.9.0/example/solr/collection1/conf/

(2)若使用solr3.6,則至此已經完成配置,但使用4.9,須要修改如下配置:【新版本已經不須要此步驟】

修改上述複製過來的schema.xml文件

刪除:<filter class="solr.EnglishPorterFilterFactory" protected="protwords.txt" /> 

增長:<field name="_version_" type="long" indexed="true" stored="true"/>

或者使用tomcat來運行solr

相關文章
相關標籤/搜索