依存句法分析器的簡單實現

生成式句法分析指的是,生成一系列依存句法樹,從它們中用特定算法挑出概率最大那一棵。句法分析中,生成模型的構建主要使用三類信息:詞性信息、詞彙信息和結構信息。前二類很好理解,而結構信息需要特殊語法標記,不做考慮。 本文主要利用了詞彙+詞性生成聯合概率模型,使用最大生成樹Prim算法搜索最終結果,得到了一個簡單的漢語依存句法分析器。 開源項目 本文代碼已集成到HanLP中開源:http://hanlp
相關文章
相關標籤/搜索