lucene4.7 分詞器(三)

筆者比較推薦的中文分詞器是IK分詞器,在進入正式的講解之前,我們首先對Lucene裏面內置的幾個分析器做個瞭解.  分析器類型 基本介紹 WhitespaceAnalyzer 以空格作爲切詞標準,不對語彙單元進行其他規範化處理 SimpleAnalyzer 以非字母符來分割文本信息,並將語彙單元統一爲小寫形式,並去掉數字類型的字符 StopAnalyzer 該分析器會去除一些常有a,the,an等
相關文章
相關標籤/搜索