python數據分析(分析文本數據和社交媒體）

時間 2020-07-25

原文原文鏈接

一、安裝NLTK pip install nltk 至此，咱們的安裝還未完成，還須要下載NLTK語料庫，下載量很是大，大約有1.8GB。能夠直接運行代碼下載、代碼以下：html import nltk nltk.download()這樣能夠直接下載NLTK語料庫了。二、濾除停用詞、姓名和數字進行文本分析時，咱們常常須要對停用詞（Stopwords）進行剔除，這裏所謂停用詞就是那些很是常見，但沒

>>阅读原文<<