《中文文本信息抽取模型與方法研究》3:事件抽取模式的自動獲取

     傳統的信息抽取系統大多是基於模式匹配的,因此,如何自動獲取抽取模式就成爲信息抽取中的一個核心問題。本章提出了一種從未標註的中文文本中基於自擴展策略自動獲取時間抽取模式的算法,該算法從少數幾個種子抽取模式開始,通過一個增量迭代的過程發現新模式,每一輪迭代從三個層次對抽取模式進行擴展,然後採用類似於TF/IDF的評估方法對產生的候選模式進行評估,選擇得分最高的幾個模式併入到當前模式集。  
相關文章
相關標籤/搜索