不同規則的中文分詞對Lucene索引的影響

不同規則的中文分詞對Lucene索引的影響<?XML:NAMESPACE PREFIX = O /> 田春峯 在中文全文索引中爲了建立反向索引需要對文檔中的句子進行切分,相關理論請參見車東的介紹。 在lucene 1.3 以後的版本中支持中文建立索引了,他默認的切分規則是按一個個漢字分的。例子見後。 這裏主要對比以下3種中文切分對lucene 索引的影響。 第一種:默認的單字切分; 第二種:二元切
相關文章
相關標籤/搜索