Solr加入中文分詞器。

        中文分詞在solr裏面是沒有默認開啓的,需要我們自己配置一箇中文分詞器。目前可用的分詞器有smartcn,IK,Jeasy,庖丁。其實主要是兩種,一種是基於中科院ICTCLAS的隱式馬爾代夫HMM算法的中文分詞器,如smartcn,ictclas4j,優點是分詞準確度高,缺點是不能使用用戶自定義詞庫;另一種是基於最大匹配的分詞器,如IK,Jeasy,庖丁,優點是可以自定義詞庫,增加
相關文章
相關標籤/搜索