Linux系统安装SCWS-1.2.3及PHP扩展

admin7年前技术文档2135

取得 scws-1.2.3 的代码

wget http://www.xunsearch.com/scws/down/scws-1.2.3.tar.bz21

解开压缩包

[hightman@d1 ~]$ tar xvjf scws-1.2.3.tar.bz21

进入目录执行配置脚本和编译

[hightman@d1 ~]$ cd scws-1.2.3
[hightman@d1 ~/scws-1.2.3]$ ./configure --prefix=/usr/local/scws
[hightman@d1 ~/scws-1.2.3]$ make
[hightman@d1 ~/scws-1.2.3]$ make install

注:这里和通用的 GNU 软件安装方式一样,具体选项参数执行 ./configure –help 查看。 
常用选项为:–prefix=

[hightman@d1 ~/scws-1.2.3]$ ls -al /usr/local/scws/lib/libscws.la1

试试执行 scws-cli 文件

[hightman@d1 ~/scws-1.2.3]$ /usr/local/scws/bin/scws -h
scws (scws-cli/1.2.3)
Simple Chinese Word Segmentation - Command line usage.
Copyright (C)2007 by hightman....

用 wget 下载并解压词典,或从主页下载然后自行解压再将 *.xdb 放入 /usr/local/scws/etc 目录中

[hightman@d1 ~/scws-1.2.3]$ cd /usr/local/scws/etc
[hightman@d1 /usr/local/scws/etc]$ wget http://www.xunsearch.com/scws/down/scws-dict-chs-gbk.tar.bz2
[hightman@d1 /usr/local/scws/etc]$ wget http://www.xunsearch.com/scws/down/scws-dict-chs-utf8.tar.bz2
[hightman@d1 /usr/local/scws/etc]$ wget http://www.xunsearch.com/scws/down/scws-dict-cht-utf8.tar.bz2
[hightman@d1 /usr/local/scws/etc]$ tar xvjf scws-dict-chs-gbk.tar.bz2
[hightman@d1 /usr/local/scws/etc]$ tar xvjf scws-dict-chs-utf8.tar.bz2
[hightman@d1 /usr/local/scws/etc]$ tar xvjf scws-dict-cht-utf8.tar.bz2

安装 php 扩展

假设您已经将 scws 按上述步骤安装到 /usr/local/scws 中。 
安装此扩展要求您的 php 和系统环境安装了相应的 autoconf automake 工具及 phpize 。

  1. 进入源码目录的 phpext/ 目录 ( cd ~/scws-1.2.3 )

  2. 执行 phpize (在PHP安装目录的bin/目录下)

  3. 执行 ./configure --with-scws=/usr/local/scws 若 php 安装在特殊目录 $php_prefix, 则请在 configure 后加上 --with-php-config=$php_prefix/bin/php-config

  4. 执行 make 然后用 root 身份执行 make install

  5. 在 php.ini 中加入以下几行 
    [scws] 

    ; 注意请检查 php.ini 中的 extension_dir 的设定值是否正确, 否则请将 extension_dir 设为空, 
    ; 再把 extension = scws.so 指定绝对路径。 

    extension = scws.so 
    scws.default.charset = utf8 
    scws.default.fpath = /usr/local/scws/etc 

  6. 重启php使新的 php.ini 生效。命令行下执行 php -m 就能看到 scws 了或者在 phpinfo() 中看看关于 scws 的部分。

  7. 如果重启php-fpm过程中出现错误信息 
    NOTICE: PHP message: PHP Warning: PHP Startup: Unable to load dynamic library '/opt/rh/php55/root/usr/lib64/php/modules/scws.so' - libscws.so.1: cannot open shared object file: No such file or directory in Unknown on line 0 
    则需要建两个软连接: 
    ln -s /usr/local/scws/lib/libscws.so.1.1.0 /usr/local/lib/libscws.so 
    ln -s /usr/local/scws/lib/libscws.so.1.1.0 /usr/local/lib/libscws.so.1

  8. 这样就算安装完成了,余下的工作只是PHP代码编写问题了。


使用php扩展:使用方法详见:https://github.com/hightman/scws/blob/master/phpext/README.md

$sh = scws_open();
scws_set_charset($sh, 'utf8');
scws_set_dict($sh, '/usr/local/scws/etc/dict.utf8.xdb');
scws_set_rule($sh, '/usr/local/scws/etc/rules.ini');
$text = "我是一个中国人,我会C++语言,我也有很多T恤衣服";
scws_send_text($sh, $text);
$top = scws_get_tops($sh, 5);
print_r($top);
Array
(
    [0] => Array
        (
            [word] => C++
            [times] => 1
            [weight] => 9.5
            [attr] => nz
        )

    [1] => Array
        (
            [word] => T恤
            [times] => 1
            [weight] => 5.5
            [attr] => n
        )

    [2] => Array
        (
            [word] => 我会
            [times] => 1
            [weight] => 4.9400000572205
            [attr] => r
        )

    [3] => Array
        (
            [word] => 很多
            [times] => 1
            [weight] => 4.9200000762939
            [attr] => m
        )

    [4] => Array
        (
            [word] => 衣服
            [times] => 1
            [weight] => 4.9200000762939
            [attr] => n
        )

)


分享到:

相关文章

golang执行系统命令os exec

os/exec Command方法func Command(name string, arg ...string) *Cmd调用示例exec.Comm...

pip使用国内镜像

国内源:新版ubuntu要求使用https源,要注意。清华:https://pypi.tuna.tsinghua.edu.cn/simple阿里云:http://mirrors.aliyun.com/...

实例分析php单引号和双引号的区别

使用php有一段时间了,在单引号和双引号的使用上,一直没有太过在意,感觉使用哪个都一样,没有发现有什么区别。例如:$name = '卡卡测速网';$name = "卡卡测速网...

一文读懂,DDD落地数据库设计实战

作者范钢,曾任航天信息首席架构师,《大话重构》一书的作者。本文根据具体实例详细描述了DDD 落实到数据库设计的整个过程阅读本文之前建议先阅读上一篇文章《万字长文,结合电商支付业务一文搞懂DDD》过去,...

nohup和&后台运行,进程查看及终止

nohup和&后台运行,进程查看及终止

1.nohup用途:不挂断地运行命令。语法:nohup Command [ Arg … ] [ & ]  无论是否将 nohup 命令的输出重定向到终端,输出都将附加到当前目录的 nohup....

php获取从百度搜索进入网站的关键词

<?php    function search_word_from() {     $referer&nb...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。