solr4.5安裝配置 linux+tomcat6.0+mmseg4j-1.9.1分詞

首先先介紹下solr的安裝配置 html

solr下載地址 我這用的solr-4.5.0)java

運行環境web

  • JDK 1.5或更高版本 下載地址(Solr 4以上版本,要求JDK 1.6)  我用的JDK1.6 )
  • 一個java servlet容器,如Tomcat 下載地址 (我用的Tomcat 6,注:JDK1.7 跟Tomcat 7貌似有兼容性問題,記於 2013.12.12)
  • 分詞mmseg4j 下載地址 (我用的1.9)

爲防止你們各類目錄搞混,安裝前先告訴你們我本身所建立使用的目錄apache

  整個運行環境我建立了四個目錄,分別用於tomcat

    一、solr源碼保存,位於/down/solrapp

    二、solr web運行環境,位於/usr/local/tomcat/webappswebapp

    三、solr 實例運行環境,位於/usr/local/solrthis

    四、jdk,位於/usr/java/jdk1.6.0_13google

  接下來的各類配置,將以此目錄進行說明。url

安裝步驟(這裏以jdk1.6 tomcat6.0 爲例,他們的安裝方式不屬於此文的講解範圍)

  • 中止的servlet容器
  • 從下載的solr包中複製solr.war到你的servlet容器的webapps目錄

    cp /down/solr/example/webapps/solr.war  /usr/local/tomcat/webapps/solr

     

  • 從下載的solr包中複製示例Solr的文件夾到您的solr實例環境。

    cp /down/solr/example/solr  /usr/local/solr

     

  • 打開 etv/profile 文件,添加以下配置,請修改成你的jdk安裝目錄:
    複製代碼
    export JAVA_HOME=/usr/java/jdk1.6.0_13
     
    export JAVA_BIN=/usr/java/jdk1.6.0_13/bin
     
    export PATH=$PATH:$JAVA_HOME/bin
     
    export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
     
    export JAVA_HOME JAVA_BIN PATH CLASSPATH
    複製代碼

     

  • 設置你的solr_home目錄,也就是前面所述「solr 實例運行環境"所在目錄  /usr/local/solr,打開如下文件,修改solr_home目錄

    vi /usr/local/tomcat/webapps/solr/WEB-INF/web.xml

    找到以下配置,取消註釋,修改value爲 /usr/local/solr    
        

    <env-entry>
           <env-entry-name>solr/home</env-entry-name>
           <env-entry-value>/usr/local/solr/</env-entry-value>
           <env-entry-type>java.lang.String</env-entry-type>
    </env-entry>

     

  • 另外還有一處要修改,但本人第一次配置solr的時候沒改此處同樣能運行,後面不知道那個環節路徑錯了,致使沒法運行,也沒去深究,修改如下配置就能運行
    打開下面文件
    vi /usr/local/solr/collection1/conf/solrconfig.xml

    修改此處路徑爲絕對路徑

      <lib dir="/down/solr/contrib/extraction/lib" regex=".*\.jar" />
      <lib dir="/down/solr/dist/" regex="solr-cell-\d.*\.jar" />
    
      <lib dir="/down/solr/contrib/clustering/lib/" regex=".*\.jar" />
      <lib dir="/down/solr/dist/" regex="solr-clustering-\d.*\.jar" />
    
      <lib dir="/down/solr/contrib/langid/lib/" regex=".*\.jar" />
      <lib dir="/down/solr/dist/" regex="solr-langid-\d.*\.jar" />
    
      <lib dir="/down/solr/contrib/velocity/lib" regex=".*\.jar" />
      <lib dir="/down/solr/dist/" regex="solr-velocity-\d.*\.jar" />

     

  • 啓動Servlet容器。

  • 打開http://localhost:8080/solr/admin solr管理後臺,驗證是否安裝成功。

    • servlet容器可能已經開始的端口不是8080其餘在...檢查servlet容器的文檔,若是你不知道這是什麼。
    • 若是已經在該端口上運行一個servlet容器,你可能沒法啓動。關閉另一個或更改你是在運行的端口。

  有關使用一個以上的索引,或者Solr中的多於一個實例的工做信息,請參閱MultipleIndexes

  有關於tomcat的英文配置講解原版http://wiki.apache.org/solr/SolrTomcat

以上步驟,配置完畢,並驗證成功後,繼續來配置mmseg4j分詞  下載地址

  首先,在你建立的solr實例目錄下,新建lib,dic兩個文件夾,一個用於存放jar文件(lib),一個用於存放詞庫(dic)

cd /usr/local/solr mkdir lib  mkdir dic

  解壓你下載的mmseg4j ,將mmseg4j /dist目錄下的jar文件拷貝至剛新建的lib文件夾,將mmseg4j /data目錄下的文件拷貝紙剛新建的dic文件夾

 

打開 /usr/local/solr/collection1/conf/solrconfig.xml文件,添加配置

 <lib dir="/usr/local/solr/lib" />

打開 /usr/local/solr/collection1/conf/schema.xml文件,分別在相應位置添加以下配置。

 

<field name="simple" type="textSimple" indexed="true" stored="true"/>  
<field name="complex" type="textComplex" indexed="true" stored="true"/>  
<field name="MaxWord" type="textMaxWord" indexed="true" stored="true"/>  

<copyField source="simple" dest="text" />  
<copyField source="complex" dest="text"/>  
<copyField source="MaxWord" dest="text"/>  

<fieldType name="textComplex" class="solr.TextField">  
  <analyzer>  
    <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="complex" dicPath="/usr/local/solr/dic"/>  
  </analyzer>  
</fieldType>  
    <fieldType name="textMaxWord" class="solr.TextField">  
  <analyzer>  
    <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="max-word" dicPath="usr/local/solr/dic"/>  
  </analyzer>  
</fieldType>  
    <fieldType name="textSimple" class="solr.TextField">  
  <analyzer>  
    <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="simple" dicPath="usr/local/solr/dic"/>  
  </analyzer>  
</fieldType>  

 

OK,到此爲止詞庫已經配置成功,重啓tomcat打開 http://localhost:8080/solr/admin 試試分詞效果吧,各類配置的詳解將在後面的文章進行說明。

相關文章
相關標籤/搜索