python之nltk基礎用法

一、NLTK進行分詞 用到的函數: nltk.sent_tokenize(text) #對文本按照句子進行分割 nltk.word_tokenize(sent) #對句子進行分詞 二、NLTK進行詞性標註 用到的函數: nltk.pos_tag(tokens)#tokens是句子分詞後的結果,同樣是句子級的標註 三、NLTK進行命名實體識別(NER) 用到的函數: nltk.ne_chunk(ta
相關文章
相關標籤/搜索