Windows 下安裝 SCWS

導語

關於分詞,如今有不少解決方法,根據本身須要進行選擇。項目中用到了 SCWS ,安裝好記錄下。php

SCWS

SCWS 是 Simple Chinese Word Segmentation 的首字母縮寫(即:簡易中文分詞系統)。
這是一套基於詞頻詞典的機械式中文分詞引擎,它能將一整段的中文文本基本正確地切分紅詞。

如上,SCWS 是一套分詞系統。雖然這套系統可能有些過期,算法不是很精確,但在某些特定場合仍是比較實用的算法

下載擴展

首先根據本身的 PHP 版本,下載相應的擴展
下載完成後,將 php_scws.dll 放到 PHP 安裝目錄的 etc/ 下。windows

下載規則集文件和詞典文件

首先新建目錄,用於存放規則集文件和詞典文件。如:D:/scws/
而後在這裏下載規則集文件,下載後解壓,將 etc/ 目錄中的 *.ini 文件放到 D:/scws/ 中。
接着在這裏下載詞典文件,將 *.xdb 文件放到 D:/scws/ 中。測試

修改 php.ini

pnp.ini 中添加 extension=php_scws.dll,同時能夠寫上配置參數:scws.default.fpath = "D:/scws/".net

測試

到此若是一切順利便安裝成功,下面進行測試code

<?php
 $string = '安能摧眉折腰事權貴,使我不得開心顏';
 $data = '';
 $obj = scws_new();

 $obj->set_charset('utf8');
 $obj->add_dict(ini_get('scws.default.fpath') . '/dict.utf8.xdb');
 $obj->set_rule(ini_get('scws.default.fpath') . '/rules.utf8.ini');
 $obj->set_duality(true);
 $obj->set_ignore(true);
 $obj->set_multi(2);
 $obj->send_text($string);

 $array = $obj->get_result();

 foreach ($array as $key => $value) {
      $data .= $value['word'] . ',';
 }

 echo rtrim($data, ',');// 安能,摧眉折腰,摧眉,眉折,折腰,事,權貴,使我,我,不得,開心,顏

參考資料:SCWSSCWS分詞擴展在windows下的安裝方法blog

相關文章
相關標籤/搜索