nltk基礎用法

一、NLTK進行分詞 用到的函數: nltk.sent_tokenize(text) #把文本分割成句子列表 nltk.word_tokenize(sent) #對句子進行分詞 注意: 返回的都是句子或單詞列表 二、NLTK進行詞性標註 用到的函數: nltk.pos_tag(tokens) #tokens是句子分詞後的結果,同樣是句子級的標註 注意:每個單詞都用一個元組表示了 三、NLTK進行命
相關文章
相關標籤/搜索