新中文分詞工具包pkuseg

北大開源全新中文分詞工具包:準確率遠超THULAC、結巴分詞 最近,北大開源了一箇中文分詞工具包,它在多個分詞數據集上都有非常高的分詞準確率。其中廣泛使用的結巴分詞誤差率高達 18.55% 和 20.42,而北大的 pkuseg 只有 3.25% 與 4.32%。 pkuseg 是由北京大學語言計算與機器學習研究組研製推出的一套全新的中文分詞工具包。它簡單易用,支持多領域分詞,在不同領域的數據上都
相關文章
相關標籤/搜索