敏感詞過濾算法:前綴樹算法

背景node 平時咱們在逛貼吧、牛客網的時候,咱們常常能夠看到一些形如 「***」的符號,經過上下文,咱們也能夠很容易猜到這些詞原來是罵人的話,只是被系統和諧了。那麼這是如何實現的呢?做爲普通人,咱們最早想到的一種辦法就是把全部敏感串存入一個列表中,而後用戶每發一條內容後臺就把該內容與敏感串列表的每一項進行匹配,而後把匹配的字符進行和諧。顯然這樣的效率是很低的。很是影響性能,那麼咱們有沒有其餘的算
相關文章
相關標籤/搜索