最近作畢設要用到ICTCLAS分詞系統,記錄一下這個過程當中碰到的問題,但願能有些同窗帶來幫助。 java
一、準備工做 git
下載下面兩個包 github
分詞系統包:http://ictclas.nlpir.org/newsdownloads?DocId=352 web
補丁包:http://ictclas.nlpir.org/newsdownloads?DocId=353 編碼
二、環境搭建 code
基本的java運行環境就不說了,主要說一下搭建一個基本的ICTCLAS分詞環境 get
2.1 新建java工程ICTCLAS(是java工程,不是java web 工程,貌似路徑上有些差異) it
2.2 將將分詞系統包解壓,將Data、test兩個文件夾拷進工程的根目錄 class
2.3 將補丁包解壓,將NLPIR_JNI.dll拷進工程根目錄,將kevin文件夾和TestNLPIR.java文件拷進工程個src 目錄下 test
目錄結構以下:
2.4對TestJLPIR.java內容做以下修改:
(1)將31行改爲這樣:
String argu = ".";
//初始化分詞組件 String argu1 = "./test/test.TXT"; String argu2 = "./test/test_result1.TXT";
出現過的問題:
1)運行結果輸出Init Fail!,這個通常是有Data包跟其它的幾個文件不匹配所致,建議分詞包和補丁包都用最新的包
2)程序報平臺錯誤,這是因爲使用的dll文件與平臺不一致致使的。要下載相應平臺的文件創建工程。
PS:附件是搭建好的源代碼
https://github.com/liangxiao0315/ICTCLAS--win7-64-java-----.git