python文本分析--停用詞表的使用

之前聽說停用詞表,沒有上手使用過,真正操作的時候發現有很多東西沒有學透徹。這裏總結一下,去停用詞的思想:在原始文本集中去掉不需要的詞彙,字符。雖然有通用的停用詞表,但是如果想提高後續的分詞效果,還是自己建立停用表比較好。 建立停用詞表,實際上就是在txt中,輸入想要刪除的詞彙,每個詞彙用空格隔開即可。可以換行。 下面是我自己操作的效果圖,及代碼。方便自己及大家查看。 # 停用詞表 [] 停用詞
相關文章
相關標籤/搜索