NLTK-003:詞典資源

詞典或者詞典資源的意思是一個 詞或短語 以及一些相關信息的集合。例如:詞性和詞意定義等相關信息。詞典資源附屬於文本,通常在文本的幫助下創建和豐富。 詞彙列表語料庫 nltk.corpus.words 僅僅包含詞彙列表的語料庫,可以用來尋找文本語料中不常見的或者拼寫錯誤的詞彙 import nltk def unusual_words(text): text_vocab = set([w.l
相關文章
相關標籤/搜索