張開旭:分詞不是一個獨立的任務,大量無標註語料是真正的金礦

作者:張開旭 CLPS-SIGHAN2012微博分詞評測第一名 最近看大家在微博上討論分詞。作爲一個分詞的同好,我也是有分詞情懷的。我是12年畢業的NLP博士。(注:NLP是神經語言程序學 (Neuro-Linguistic Programming))課題就是分詞,做課題期間讀了幾乎所有的主要文獻,也自己重現過主流的方法,包括最大匹配,CRF,感知器,基於詞的方法等等。 遺憾的是自己沒有寫出高水平
相關文章
相關標籤/搜索