ElasticSearch1.7之ik(中文)分詞器的自定義分詞擴展方式

隨着數據量的越來越大,有一些定義的關鍵詞已經不再是常用詞彙,超出了ES自帶的ik分詞詞庫範圍,比如:「奧利給」等別稱和新聞話題詞;這就出現了一些現象,如搜索「奧利給」,因爲ik詞庫沒有此詞,故將詞分爲若干個字,檢索時會將同時含有「奧」、「利」、「給」三個字的新聞都返回,就出現不準確的現象,很嚴重; 因此,我們要根據客戶需求在系統中自定義分詞詞庫,將這些詞統一加入到詞庫中。   操作流程: 1. c
相關文章
相關標籤/搜索