当前位置:首页 > 技术文档 > 正文内容

Linux系统安装SCWS-1.2.3及PHP扩展

admin7年前 (2018-07-23)技术文档2149

取得 scws-1.2.3 的代码

wget http://www.xunsearch.com/scws/down/scws-1.2.3.tar.bz21

解开压缩包

[hightman@d1 ~]$ tar xvjf scws-1.2.3.tar.bz21

进入目录执行配置脚本和编译

[hightman@d1 ~]$ cd scws-1.2.3
[hightman@d1 ~/scws-1.2.3]$ ./configure --prefix=/usr/local/scws
[hightman@d1 ~/scws-1.2.3]$ make
[hightman@d1 ~/scws-1.2.3]$ make install

注:这里和通用的 GNU 软件安装方式一样,具体选项参数执行 ./configure –help 查看。 
常用选项为:–prefix=

[hightman@d1 ~/scws-1.2.3]$ ls -al /usr/local/scws/lib/libscws.la1

试试执行 scws-cli 文件

[hightman@d1 ~/scws-1.2.3]$ /usr/local/scws/bin/scws -h
scws (scws-cli/1.2.3)
Simple Chinese Word Segmentation - Command line usage.
Copyright (C)2007 by hightman....

用 wget 下载并解压词典,或从主页下载然后自行解压再将 *.xdb 放入 /usr/local/scws/etc 目录中

[hightman@d1 ~/scws-1.2.3]$ cd /usr/local/scws/etc
[hightman@d1 /usr/local/scws/etc]$ wget http://www.xunsearch.com/scws/down/scws-dict-chs-gbk.tar.bz2
[hightman@d1 /usr/local/scws/etc]$ wget http://www.xunsearch.com/scws/down/scws-dict-chs-utf8.tar.bz2
[hightman@d1 /usr/local/scws/etc]$ wget http://www.xunsearch.com/scws/down/scws-dict-cht-utf8.tar.bz2
[hightman@d1 /usr/local/scws/etc]$ tar xvjf scws-dict-chs-gbk.tar.bz2
[hightman@d1 /usr/local/scws/etc]$ tar xvjf scws-dict-chs-utf8.tar.bz2
[hightman@d1 /usr/local/scws/etc]$ tar xvjf scws-dict-cht-utf8.tar.bz2

安装 php 扩展

假设您已经将 scws 按上述步骤安装到 /usr/local/scws 中。 
安装此扩展要求您的 php 和系统环境安装了相应的 autoconf automake 工具及 phpize 。

  1. 进入源码目录的 phpext/ 目录 ( cd ~/scws-1.2.3 )

  2. 执行 phpize (在PHP安装目录的bin/目录下)

  3. 执行 ./configure --with-scws=/usr/local/scws 若 php 安装在特殊目录 $php_prefix, 则请在 configure 后加上 --with-php-config=$php_prefix/bin/php-config

  4. 执行 make 然后用 root 身份执行 make install

  5. 在 php.ini 中加入以下几行 
    [scws] 

    ; 注意请检查 php.ini 中的 extension_dir 的设定值是否正确, 否则请将 extension_dir 设为空, 
    ; 再把 extension = scws.so 指定绝对路径。 

    extension = scws.so 
    scws.default.charset = utf8 
    scws.default.fpath = /usr/local/scws/etc 

  6. 重启php使新的 php.ini 生效。命令行下执行 php -m 就能看到 scws 了或者在 phpinfo() 中看看关于 scws 的部分。

  7. 如果重启php-fpm过程中出现错误信息 
    NOTICE: PHP message: PHP Warning: PHP Startup: Unable to load dynamic library '/opt/rh/php55/root/usr/lib64/php/modules/scws.so' - libscws.so.1: cannot open shared object file: No such file or directory in Unknown on line 0 
    则需要建两个软连接: 
    ln -s /usr/local/scws/lib/libscws.so.1.1.0 /usr/local/lib/libscws.so 
    ln -s /usr/local/scws/lib/libscws.so.1.1.0 /usr/local/lib/libscws.so.1

  8. 这样就算安装完成了,余下的工作只是PHP代码编写问题了。


使用php扩展:使用方法详见:https://github.com/hightman/scws/blob/master/phpext/README.md

$sh = scws_open();
scws_set_charset($sh, 'utf8');
scws_set_dict($sh, '/usr/local/scws/etc/dict.utf8.xdb');
scws_set_rule($sh, '/usr/local/scws/etc/rules.ini');
$text = "我是一个中国人,我会C++语言,我也有很多T恤衣服";
scws_send_text($sh, $text);
$top = scws_get_tops($sh, 5);
print_r($top);
Array
(
    [0] => Array
        (
            [word] => C++
            [times] => 1
            [weight] => 9.5
            [attr] => nz
        )

    [1] => Array
        (
            [word] => T恤
            [times] => 1
            [weight] => 5.5
            [attr] => n
        )

    [2] => Array
        (
            [word] => 我会
            [times] => 1
            [weight] => 4.9400000572205
            [attr] => r
        )

    [3] => Array
        (
            [word] => 很多
            [times] => 1
            [weight] => 4.9200000762939
            [attr] => m
        )

    [4] => Array
        (
            [word] => 衣服
            [times] => 1
            [weight] => 4.9200000762939
            [attr] => n
        )

)


分享到:

扫描二维码推送至手机访问。

版权声明:本文由云河空间发布,如需转载请注明出处。

本文链接:http://yuyunhe.cn/index.php/post/276.html

分享给朋友:

“Linux系统安装SCWS-1.2.3及PHP扩展” 的相关文章

PHP分页函数仿Google分页

/**  * 分页函数  * @param int $total    总页数  * @param int $pagesize 每页几条 &n...

利用ctrl+v实现粘贴截图完成上传功能

<?php header("Access-Control-Allow-Origin:*"); $url  = 'http://'.$_SERVER['HTTP_HOST']; $file =&nb...

Zend Studio 8打开utf-8文件出现乱码解决方法

Zend Studio 8打开utf-8文件出现乱码解决方法

今天安装了zend studio 8.0.1,运行了一个PHP程序项目(项目文件编码为utf-8),发现utf-8文件中的中文全部变成乱码了,后面终于经过寻找探索,找到了问题所 在:虽然你的项目是UTF-8编码文件,但是当通过zend studio工具运行打开时,是以工具里设定的GBK编码...

git的几个小技巧

git的几个小技巧

分享git的几个小技巧,后面会根据使用补充。目前包括git撤销本地修改、git回退到前n个版本、git多用户提交冲突解决、git 命令简化。欢迎大家补充^_*1、git撤销本地修改 Java git reset --hard origin/ma...

phpcms v9更换模板的具体操作方法

phpcms v9更换模板的具体操作方法

这篇文章主要介绍了phpcms v9更换模板的具体操作方法,需要的朋友可以参考下分享一下Phpcms V9更换模板的具体操作方法先分享下大概的步骤:1、上传模版文件到服务器;2、在站点管理 里边【模板风格配置】选择新模板;3、设置不同模型对应模板;4、修改现有的栏目,匹配新模板;5、更新栏目缓存、系...

推荐一些国内的Jquery CDN免费服务

Jquery是个非常流行的JS前端框架,在很多网站都能看到它的身影。很多网站都喜欢采用一些Jquery CDN加速服务,这样网站加载jquery会更快。之前火端网络的一些网站都是使用Google的jquery CDN,如:http://ajax.googleapis.com/ajax/lib...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。