自然語言處理 | (4)英文文本處理與NLTK

本篇博客我們將介紹使用NLTK對英文文本進行一些基本處理,之後我們還會學習一些更高級的模型或方法,不過這些基本處理要熟練掌握,因爲他們可以對我們的數據進行一些預處理,作爲更高級模型或工具的輸入。 目錄 1.NLTK簡介 2.英文Tokenization(標記化/分詞) 3.停用詞 4.詞性標註 5.chunking/組塊分析 6.命名實體識別 7.Stemming和Lemmatizing 8.Wo
相關文章
相關標籤/搜索