UGC社區敏感詞過濾原理

UGC社區是以用戶原創內容爲主的移動互聯網線上社區,其前身是網頁端的bbc論壇。社區型平臺每天會產生大量由用戶自發形成的內容,有文字、圖片、視頻等形式,當然現在還有直播等形式的內容,由於用戶層次的不同,產生的內容自然就有優劣之分,同時,有人的地方就會有商機,自然不乏廣告或者垃圾信息的存在,因此需要對這些東西進行過濾。 傳統的方式是使用KMP算法對用戶輸入的字符串進行敏感詞的匹配,然後將敏感詞刪除或
相關文章
相關標籤/搜索