SolrCloud (jetty) 添加mmseg4j 分詞

本文環境是創建在solr集羣上面的,未搭建環境的小夥伴能夠移步至:http://my.oschina.net/u/2561483/blog/704307 web

1. 下載mmseg4j的jar包

須要兩個jar : mmseg4j-core-1.10.0.jar   mmseg4j-solr-2.3.0.jarbash

2. 加載jar包

將jar 放到solr集羣中,下面的節點都要放。具體放在 個人目錄是:/root/solr-5.4.0/dist測試

而後配置solr參數 在你建立的collection的配置文件solrconfig.xml中加入spa

好比個人是~/solr_home/webpage/conf/ 下面的solrconfig.xml:.net

<lib dir="${solr.install.dir:../../../..}/dist/" regex=".*\.jar" />

在建立collection的時候將dist下面的jar包加載進去code

配置schema.xml 加入自定義的字段 和分詞類型:server

<!-- mmseg4j -->
    <fieldType name="text_zh" class="solr.TextField" positionIncrementGap="100">
    <span style="white-space:pre">    </span><analyzer>
    <span style="white-space:pre">        </span><tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="complex" />
    <span style="white-space:pre">    </span></analyzer>
    </fieldType>

<field name="my_content" type="text_zh" indexed="true" stored="false" multiValued="true"/>

3.  solrcloud命令建立collection:

./bin/solr create_collection -c students -d server/solr/configsets/sample_techproducts_configs/conf -shards 3 -replicationFactor 3

4. 能夠到solr管理界面查看

點這個schema browser 搜索你自定義的字段 my_content 能夠查看狀態了。xml

這說明字段都添加成功了。blog

還能夠檢查分詞的效果,在solr 管理界面左側邊欄選 項,輸入測試語句,點擊Analyse Values就能夠啦:token

出現這樣的效果說明分詞成功~

相關文章
相關標籤/搜索