基於倒排索引的組合敏感詞過濾

1. 問題原型: 給定一段UGC文本或者網頁文本,其中含有不少的敏感詞或者無效詞,可是有一些詞只有和其餘詞一塊兒出現的時候纔算是敏感詞,咱們稱其爲組合敏感詞,須要一種算法,找到其中的組合敏感詞和單個敏感詞算法 2. 求解思路:   2.1 單敏感詞求解:     2.1.1 暴力求解: 將文本內容逐個和設定的敏感詞(如下稱之爲模式)進行比較,算法的複雜度爲O(m*n*k),其中m爲文本長度,n爲模
相關文章
相關標籤/搜索