數據挖掘之自然語言處理

NLTK是python上著名的自然語言處理庫,自帶語料庫、詞性分類庫、自帶分類、分詞等等功能。 安裝語料庫import nlk   nlk.download() 文本處理流程 最後從文本轉換爲一組數字,這些數字就隱含了文本的意義。 stopwords:對於注重理解文本意思的應用場景來說歧義太多,所以要去掉。 NLTK在NLP上的經典應用有情感分析、文本相似度、文本分類。
相關文章
相關標籤/搜索