高效Java實現敏感詞過濾算法工具包

2.0版本提供更高效的標點符號的判斷跳過過程 舊版請參考本人2011年博文:高效Java敏感詞、關鍵詞過濾工具包_過濾非法詞句 本文是Java敏感詞過濾的原理以及工具包的提供地址,原理:基於多叉樹的查找。 第一步:把敏感詞讀入搜索多叉樹中, 樹結構:   第二步,對需過濾的句子進行逐字匹配: 比如句子:解放了全中國 1、記錄起始位置start=0,讀到了「解」,匹配了搜索樹中起始節點的的「解」字;
相關文章
相關標籤/搜索