文本信息過濾中的變體詞識別(一)

文本信息過濾中的變體詞識別(一) 變體詞識別概述 最近在搞文本過濾的一些工作,有一些變體詞識別相關的工作,比較多的參考了達觀數據的一些公開分享,我這裏準備分三篇文章做一些總結,這是第一篇: 先來一個嚴謹的定義: 網絡書寫具有隨意性、非正規性等特點。變體詞就是網絡語言作爲一種不規範語言的顯著特色, 人們往往出於避免審查、表達情感、諷刺、娛樂等需求將相對嚴肅、規範、敏感的詞用相對不規範、不敏感的詞來代
相關文章
相關標籤/搜索