第四課 kaggle天然語言處理

NLTK 天然語言處理庫,自帶語料庫,詞性分類庫。要記得安裝語料庫。python import nltk nltk.download() Tokenize  拆句子,拆小正則表達式 英文分詞數組 import nltk sentence = 'hello world' tokens = nltk.word_tokenize(sentence) tokens 社交語言的分詞 表情符號須要用正則表達式
相關文章
相關標籤/搜索