菜鳥如何使用Hanlp

boss給了個做分詞的任務,最開始想用的是結巴分詞and正則表達式。後來發現結果並不好,需要一遍一遍篩選【第一個標準篩選出80%的數據,然後制定第二個標準,繼續篩選,然後制定第三個標準篩選,等等等等】 自己用了一下結巴分詞,感覺對於人名,地名,機構名,只是泛泛地使用了一下。在實際分開的時候,並不能很好地分開機構名稱。於是轉而使用hanlp分詞 但是hanlp分詞的缺點是隻有在java上可以用,但是
相關文章
相關標籤/搜索