基於HMM和規則相結合的中文地名識別方法

基於機器學習和規則相結合的中文地名識別方法 命名實體識別是自然語言處理中的一個常見任務,方法也越趨於成熟。本人最近正在做事件抽取相關工作,對於事件中地址元素的識別稍有經驗,所以寫下本文,以對前面工作做一個總結。 1、詞庫的整理 中國地名畢竟有限,所以我們選擇爬取中國統計局2016年統計用區劃代碼和城鄉劃分代碼中的地名作爲基本地名詞庫,補充到分詞器中。分詞器選擇Hanlp。 對網頁進行整理後,共收錄
相關文章
相關標籤/搜索