依存句法分析器的簡單實現

時間 2021-01-12

原文原文鏈接

生成式句法分析指的是，生成一系列依存句法樹，從它們中用特定算法挑出概率最大那一棵。句法分析中，生成模型的構建主要使用三類信息：詞性信息、詞彙信息和結構信息。前二類很好理解，而結構信息需要特殊語法標記，不做考慮。本文主要利用了詞彙+詞性生成聯合概率模型，使用最大生成樹Prim算法搜索最終結果，得到了一個簡單的漢語依存句法分析器。開源項目本文代碼已集成到HanLP中開源：http://hanlp

>>阅读原文<<