Greedy NLP Learning Notes(二)

1.NLP項目的流程 NLP pipeline Normalizaition:英文中應用比較多,如apple、apples=>apple;go、went=>go。 2.分詞 word segentation 2.1.基於匹配規則的分詞方法 前向最大匹配(貪心算法) 前向最大匹配 後向最大匹配(貪心算法) 後向最大匹配 「基於匹配規則的分詞法」的缺點: 只能找局部最優的解 max_len導致效率低下
相關文章
相關標籤/搜索