譯自Matthew的《A Good Part-of-Speech Tagger in about 200 Lines of Python》,本文用最精簡的代碼演示瞭如何寫一個基於感知機的高性能詞性標註器。如下是正文:天然語言處理的最新技術大部分都停留在學術界,但學術界每每很是謹慎、不肯意把話說滿以避免做繭自縛。但太謙虛也沒有意義,本文就展現瞭如何寫一個高性能的詞性標註器。如今有成千上萬種所謂的「最好的詞性標註技術」,但它們都沒有卵用,你用Averaged Perceptron就好了。(譯註:術語Average...