上一節最後講到了創建一個extractor的方法,手工創建和機器學習等,這一節詳細闡述手工創建pattern的方法。引用Jurafsky教授常說的話:機器學習
let's look at the intuition.學習
Jurafsky教授講話老是微皺着眉頭,感受很較真的樣子,十分可愛。ui
人工模式的概念很簡單,譬如這樣一句話:和毓婷同樣,新斯諾滴丸是一種避孕藥。spa
假如你年紀還小不知道什麼是新斯諾滴丸,那你看到「XXX是一種XXX」這樣一個模式之後,你也會知道新斯諾滴丸就是一種避孕藥。「和XXX同樣也是一種模式」,譬如你就知道了新斯諾滴丸和毓婷屬於同一種東西。it
手工模式的優缺點(Plus and Minus)io
優勢:引用
準確率高、可以定製某些特色的行業方法
缺點:行業
召回率低、麻煩、想這些模式要想破腦殼let
之前作車牌識別最後匹配字模的時候就用到了手工模式,精準是精準,確實很麻煩,並且不具通用性。