北京大學開源分詞工具pkuseg 初試與使用感受

本部分內容部分來自:https://github.com/lancopku/PKUSeg-python 1.前言 最近看到一些博文介紹了北大的一個開源的中文分詞工具包pkuseg。其中說到,它在多個分詞數據集上都有非常高的分詞準確率,我們所知道的,也經常使用的結巴分詞誤差率高達 18.55% 和 20.42,而北大的 pkuseg 只有 3.25% 與 4.32%。當然還有其他的分詞工具,如:清華
相關文章
相關標籤/搜索