Elasticsearch分詞機制、IK分詞器、自定義分詞、批量管理

分詞 分詞是指文本轉換成一系列單詞(term or token)的過程,也可以叫做文本分析,關鍵詞爲Analysis。 舉例 彭于晏是最帥的明星 分詞爲:(彭于晏)(最帥)(明星) Character Filter 分詞機制 效果 Character Filter 對原始文件進行處理:例如去除html標籤,特殊字符等 Tokenizer 將原始文件進行分詞:例:二院二部(二院、二部) Token
相關文章
相關標籤/搜索