solr自定義分詞器

目的:在對英文句子分詞的時候,一般採用採用的分詞器是WhiteSpaceTokenizerFactory,有一次因業務要求,需要根據某一個特殊字符(以逗號分詞,以豎線分詞)分詞。如圖1,我輸入 "中華,人民,共和國",如果用ik分詞器,會分成如圖1的效果,用自定義按逗號分割的分詞器,會分成如圖2的效果。  圖(1)    圖(2) 1.加入jar包 <dependency>   <groupId>
相關文章
相關標籤/搜索