爲Elasticsearch添加中文分詞,對比分詞器效果

lasticsearch中,內置了很多分詞器(analyzers),例如standard (標準分詞器)、english(英文分詞)和chinese (中文分詞)。其中standard 就是無腦的一個一個詞(漢字)切分,所以適用範圍廣,但是精準度低;english 對英文更加智能,可以識別單數負數,大小寫,過濾stopwords(例如「the」這個詞)等;chinese 效果很差,後面會演示。這次
相關文章
相關標籤/搜索