pyhanlp 中文詞性標註與分詞簡介

  pyhanlp實現的分詞器有很多,同時pyhanlp獲取hanlp中分詞器也有兩種方式 第一種是直接從封裝好的hanlp類中獲取,這種獲取方式一共可以獲取五種分詞器,而現在默認的就是第一種維特比分詞器 1.維特比 (viterbi):效率和效果的最佳平衡。也是最短路分詞,HanLP最短路求解採用Viterbi算法 2.雙數組trie樹 (dat):極速詞典分詞,千萬字符每秒(可能無法獲取詞性,
相關文章
相關標籤/搜索