自然語言處理(二)

任務要求: 基本文本處理技能:中英文字符串處理(刪除不相關的字符、去停用詞);分詞(結巴分詞);詞、字符頻率統計。 語言模型;unigram、bigram、trigram頻率統計。 jiebe分詞介紹和使用 1.中英文字符串處理(刪除不相關的字符、去停用詞 以保留相關字符方式刪除不相關字符 去除停用詞 jieba分詞 jieba分詞有三種模式,精確模式,全模式,搜索引擎模式 詞、字符頻率統計  
相關文章
相關標籤/搜索