Solr(3.中文分詞器)

lucence有很多優秀的分詞器,但是由於lucene是外國人開發的,所以分詞器相應的也是對英文更加友好,雖然隨着lucence版本的跟進,中文分詞有一定的優化,可還是很難做到中國人的習慣。 IK分詞器就是一款中國人開發的,擴展性很好的中文分詞器,它支持擴展詞庫,可以自己定製分詞項,這對中文分詞無疑是友好的。 但是IK分詞器從2012年就停止更新了,爲了支持最新版的solr,對IK的源碼進行了稍許
相關文章
相關標籤/搜索