hanlp提取文本關鍵詞的使用方法記錄

本文是csu_zipple 分享的關於使用hanlp漢語言處理包提取關鍵詞的過程一個簡單的記錄分享。想要使用hanlp提取文本關鍵詞的新手朋友們能夠參考學習一下!git

如何在一段文本之中提取出相應的關鍵詞呢? 以前有想過用機器學習的方法來進行詞法分析,可是在項目中測試時正確率不夠。因而這時候便有了 HanLP-漢語言處理包 來進行提取關鍵詞的想法。機器學習

   下載:.jar .properties data等文件學習

請到大快搜索官網下載 HanLP新版本,1.7.1數據包下載【gitub上也能夠下載】測試

   在intellij中配置環境,並運行第一個demospa

在項目中配置jar包,添加依賴。3d

file->Project Structure->Modules->Dependencies->+Jarsblog

將properties文件轉移到src根目錄下,修改root爲本身的數據集路徑ip

  運行第一個democi

 

1 public class TestHanLP {it

2    public static void main(String[] args) {

3        System.out.println(HanLP.segment("你好,歡迎使用HanLP!"));

4    }

5 }

 

可能的錯誤

 

字符類型對應表加載失敗:D:/BaiduYunDownload/data-for-1.3.3/data/dictionary/other/CharType.dat.yes

 

解決辦法:查看錯誤提示頁面下是否有該文件,若是沒有則去網上下載一個。像我這裏,因爲只是使用其一部分功能,爲了方便就再也不下載了,這裏我直接修改了一個文件的文件名—–成功運行!。

成功運行

相關文章
相關標籤/搜索