天然語言處理工具包 - NLTK

文本分詞 分詞處理相關API:python import nltk.tokenize as tk # 把樣本按句子進行拆分 sent_list:句子列表 sent_list = tk.sent_tokenize(text) # 把樣本按單詞進行拆分 word_list:單詞列表 word_list = tk.word_tokenize(text) # 把樣本按單詞進行拆分 punctTokeniz
相關文章
相關標籤/搜索