nltk詞性標註

將詞彙按它們的詞性(parts-of-speech,POS)分類以及相應的標註它們的過程被稱爲詞
性標註(part-of-speech tagging, POS tagging)或乾脆簡稱標註。詞性也稱爲詞類或詞彙範
疇。用於特定任務的標記的集合被稱爲一個標記集。python

 

使用詞性標註器進行英文的詞性標註。spa

1. 打開cmd,輸入python,進入python編譯環境。3d

import nltk

text =nltk.word_tokenize("And now for something completely different")
nltk.pos_tag(text)

一開始報錯:code

那麼多,看都不想看。不想看也不行,慢慢看唄,答案確定就在這裏面。blog

看了下,還真找到了,token

按照步驟來,使用下載器獲取資源。資源

而後再運行開始的代碼,結果以下:cmd

[('And', 'CC'), ('now', 'RB'), ('for', 'IN'), ('something', 'NN'), ('completely', 'RB'), ('different', 'JJ'), ('.', '.')]編譯

在這裏咱們看到and 是CC,並列連詞;now 和completely 是RB,副詞;for 是IN,介
詞;something 是NN,名詞;different 是JJ,形容詞。class

2. 另外一個例子,此次包括一些同形同音異義詞:

相關文章
相關標籤/搜索