如何編譯運行HanLP天然語言處理包

master分支java

對於master分支,編譯方法以下:git

git clone  https://github.com/hankcs/HanLP.gitgithub

mvn install -DskipTests單元測試

 

·因爲目前一些test不夠規範,使用了硬編碼路徑下的資源,因此暫時跳過單元測試。測試

·該方法不會將src/main/resources目錄下的任何資源(包括hanlp.properties)打包進jar,若是須要打包資源文件,請切換到portable分支。編碼

portable分支spa

git checkout portable命令行

而後將須要的data放入src/main/resources,最後執行:blog

 

mvn install -DskipTestsip

運行jar

目前jar包中有一些模塊能夠命令行執行,以感知機詞法分析器爲例。因爲這些模塊通常須要加載外部data,因此須要在運行時指定hanlp.properties。運行時,一個典型的目錄結構以下:

·此處只列出了重要的目錄。

·一個良好的實踐是把hanlp.properties放到resources目錄下。

 

命令行須要指定jar包和hanlp.properties所在的目錄:

 

$ java -cp target/hanlp-1.6.0.jar:src/main/resources  com.hankcs.hanlp.model.perceptron.Main -test \

<<< '華安集團胡花蕊來到紐約藝術博物館參觀'

[華安/nz 集團/n]/nt 胡花蕊/nr 來到/v [紐約/ns 藝術/n 博物館/n]/ns 參觀/v

 

·Windows用戶請使用分號java -cp target/hanlp-1.6.0.jar;src/main/resources

相關文章
相關標籤/搜索