將詞彙按它們的詞性(parts-of-speech,POS)分類以及相應的標註它們的過程被稱爲詞
性標註(part-of-speech tagging, POS tagging)或乾脆簡稱標註。詞性也稱爲詞類或詞彙範
疇。用於特定任務的標記的集合被稱爲一個標記集。python
使用詞性標註器進行英文的詞性標註。spa
1. 打開cmd,輸入python,進入python編譯環境。3d
import nltk text =nltk.word_tokenize("And now for something completely different") nltk.pos_tag(text)
一開始報錯:code
那麼多,看都不想看。不想看也不行,慢慢看唄,答案確定就在這裏面。blog
看了下,還真找到了,token
按照步驟來,使用下載器獲取資源。資源
而後再運行開始的代碼,結果以下:cmd
[('And', 'CC'), ('now', 'RB'), ('for', 'IN'), ('something', 'NN'), ('completely', 'RB'), ('different', 'JJ'), ('.', '.')]編譯
在這裏咱們看到and 是CC,並列連詞;now 和completely 是RB,副詞;for 是IN,介
詞;something 是NN,名詞;different 是JJ,形容詞。class
2. 另外一個例子,此次包括一些同形同音異義詞: