百萬級通過驗證的分詞詞庫,千萬級Ngram

    因工做須要,最近在作天然語言處理方面的研究,第一步須要實現中文分詞,市面上有許多開源的分詞組件,本人使用的是word分詞,但這些開源組件中的詞庫都比較小,所以這段時間主要是在網上爬了各類詞庫,並經過XX詞典校驗,挑選在XX詞典中收錄的(耗費至關多的精力)。算法     彙總詞庫:https://download.csdn.net/download/qengland/10522790 優化
相關文章
相關標籤/搜索