SCWS-1.2.3 安裝說明

以 Linux(FreeBSD) 操做系統爲例,實踐證實:CentOS也沒問題。

1. 取得 scws-1.2.3 的代碼
wget http://www.xunsearch.com/scws/down/scws-1.2.3.tar.bz2

2. 解開壓縮包
[hightman@d1 ~]$ tar xvjf scws-1.2.3.tar.bz2

3. 進入目錄執行配置腳本和編譯
[hightman@d1 ~]$ cd scws-1.2.3php

[hightman@d1 ~/scws-1.2.3]$ ./configure --prefix=/usr/local/scws --enable-namerule ; make ; make install
//人名地名識別調整爲編譯選項 --enable-namerule 默認不開啓web


注:這裏和通用的 GNU 軟件安裝方式同樣,具體選項參數執行 ./configure --help 查看。
經常使用選項爲:--prefix=<scws的安裝目錄>

4. 順利的話已經編譯並安裝成功到 /usr/local/scws 中了,執行下面命令看看文件是否存在
[hightman@d1 ~/scws-1.2.3]$ ls -al /usr/local/scws/lib/libscws.la

5. 試試執行 scws-cli 文件
[hightman@d1 ~/scws-1.2.3]$ /usr/local/scws/bin/scws -h
scws (scws-cli/1.2.3)
Simple Chinese Word Segmentation - Command line usage.
Copyright (C)2007 by hightman.
...

6 用 wget 下載並解壓詞典,或從主頁下載而後自行解壓再將 *.xdb 放入 /usr/local/scws/etc 目錄中
[hightman@d1 ~/scws-1.2.3]$ cd /usr/local/scws/etc
[hightman@d1 /usr/local/scws/etc]$ wget http://www.xunsearch.com/scws/down/scws-dict-chs-gbk.tar.bz2
[hightman@d1 /usr/local/scws/etc]$ wget http://www.xunsearch.com/scws/down/scws-dict-chs-utf8.tar.bz2
[hightman@d1 /usr/local/scws/etc]$ tar xvjf scws-dict-chs-gbk.tar.bz2
[hightman@d1 /usr/local/scws/etc]$ tar xvjf scws-dict-chs-utf8.tar.bz2

7. 寫個小程序測試一下
[hightman@d1 ~]$ cat > test.c
#include <scws.h>
#include <stdio.h>
main()
{
  scws_t s;
  s = scws_new();
  scws_free(s);
  printf("test ok!\n");
}

8. 編譯測試程序
gcc -o test -I/usr/local/scws/include -L/usr/local/scws/lib test.c -lscws -Wl,--rpath -Wl,/usr/local/scws/lib
./test

9. 這樣就好順利安裝完畢能夠使用 libscws 這套 C-API 了

10. 若是您須要在 php 中調用分詞,建議繼續閱讀本文安裝 php 擴展,不然可跳過不看。

    假設您已經將 scws 按上述步驟安裝到 /usr/local/scws 中。
    安裝此擴展要求您的 php 和系統環境安裝了相應的 autoconf automake 工具及 phpize 。

    1) 進入源碼目錄[是指第1步中的scws源碼]的 phpext/ 目錄 ( cd ~/scws-1.2.3 )
    2) 執行 phpize (在PHP安裝目錄的bin/目錄下,如: /usr/local/php/bin/phpize)
    3) 執行 ./configure --with-scws=/usr/local/scws
       若 php 安裝在特殊目錄 $php_prefix, 則請在 configure 後加上 --with-php-config=$php_prefix/bin/php-config
        如:./configure --with-scws=/usr/local/scws --with-php-config=/usr/local/php/bin/php-config   小程序

    4) 執行 make 而後用 root 身份執行 make install     
    5) 在 php.ini 中加入如下幾行

[scws]
;
; 注意請檢查 php.ini 中的 extension_dir 的設定值是否正確, 不然請將 extension_dir 設爲空,
; 再把 extension = scws.so 指定絕對路徑。
;
extension = scws.so
scws.default.charset = gbk
scws.default.fpath = /usr/local/scws/etc

    6) 命令行下執行 php -m 就能看到 scws 了或者在 phpinfo() 中看看關於 scws 的部分,記得要重啓 web 服務器
       才能使新的 php.ini 生效。
    7) 這樣就算安裝完成了,餘下的工做只是PHP代碼編寫問題了。
       關於 PHP 擴展的使用說明請參看代碼中 phpext/README.md 文件或其它文檔章節。
  PHP應用scws例子:服務器

$cws = scws_new(); 
$cws->set_charset('gbk'); 
$cws->set_rule('/home1/wwwroot/scws/rules.ini'); 
$cws->set_dict('/home1/wwwroot/scws/dict.xdb'); 
$cws->add_dict('/home1/wwwroot/scws/dict_extra.txt',SCWS_XDICT_TXT); //自定義詞庫
         
$cws->send_text($keys); 
$keywordsA = array(); 
$wordsA = array(); 
while ($some = $cws->get_result()) 
{ 
    foreach ($some as $word) 
    { 
          $keywordsA[] = $word; 
     } 
}
print_r($keywordsA);

  注意點:
1.php.ini的配置,要加入/home1/wwwroot/scws/此路徑爲PHP容許的路徑;
2.若是編碼是GBK則自定義詞庫文件dict_extra.txt必須是ASIN;若是編碼是UTF8則自定義詞庫文件dict_extra.txt必須是UTF-8。工具

相關文章
相關標籤/搜索