当前位置:首页 > 技术文档 > 正文内容

Linux系统安装SCWS-1.2.3及PHP扩展

admin7年前 (2018-07-23)技术文档2157

取得 scws-1.2.3 的代码

wget http://www.xunsearch.com/scws/down/scws-1.2.3.tar.bz21

解开压缩包

[hightman@d1 ~]$ tar xvjf scws-1.2.3.tar.bz21

进入目录执行配置脚本和编译

[hightman@d1 ~]$ cd scws-1.2.3
[hightman@d1 ~/scws-1.2.3]$ ./configure --prefix=/usr/local/scws
[hightman@d1 ~/scws-1.2.3]$ make
[hightman@d1 ~/scws-1.2.3]$ make install

注:这里和通用的 GNU 软件安装方式一样,具体选项参数执行 ./configure –help 查看。 
常用选项为:–prefix=

[hightman@d1 ~/scws-1.2.3]$ ls -al /usr/local/scws/lib/libscws.la1

试试执行 scws-cli 文件

[hightman@d1 ~/scws-1.2.3]$ /usr/local/scws/bin/scws -h
scws (scws-cli/1.2.3)
Simple Chinese Word Segmentation - Command line usage.
Copyright (C)2007 by hightman....

用 wget 下载并解压词典,或从主页下载然后自行解压再将 *.xdb 放入 /usr/local/scws/etc 目录中

[hightman@d1 ~/scws-1.2.3]$ cd /usr/local/scws/etc
[hightman@d1 /usr/local/scws/etc]$ wget http://www.xunsearch.com/scws/down/scws-dict-chs-gbk.tar.bz2
[hightman@d1 /usr/local/scws/etc]$ wget http://www.xunsearch.com/scws/down/scws-dict-chs-utf8.tar.bz2
[hightman@d1 /usr/local/scws/etc]$ wget http://www.xunsearch.com/scws/down/scws-dict-cht-utf8.tar.bz2
[hightman@d1 /usr/local/scws/etc]$ tar xvjf scws-dict-chs-gbk.tar.bz2
[hightman@d1 /usr/local/scws/etc]$ tar xvjf scws-dict-chs-utf8.tar.bz2
[hightman@d1 /usr/local/scws/etc]$ tar xvjf scws-dict-cht-utf8.tar.bz2

安装 php 扩展

假设您已经将 scws 按上述步骤安装到 /usr/local/scws 中。 
安装此扩展要求您的 php 和系统环境安装了相应的 autoconf automake 工具及 phpize 。

  1. 进入源码目录的 phpext/ 目录 ( cd ~/scws-1.2.3 )

  2. 执行 phpize (在PHP安装目录的bin/目录下)

  3. 执行 ./configure --with-scws=/usr/local/scws 若 php 安装在特殊目录 $php_prefix, 则请在 configure 后加上 --with-php-config=$php_prefix/bin/php-config

  4. 执行 make 然后用 root 身份执行 make install

  5. 在 php.ini 中加入以下几行 
    [scws] 

    ; 注意请检查 php.ini 中的 extension_dir 的设定值是否正确, 否则请将 extension_dir 设为空, 
    ; 再把 extension = scws.so 指定绝对路径。 

    extension = scws.so 
    scws.default.charset = utf8 
    scws.default.fpath = /usr/local/scws/etc 

  6. 重启php使新的 php.ini 生效。命令行下执行 php -m 就能看到 scws 了或者在 phpinfo() 中看看关于 scws 的部分。

  7. 如果重启php-fpm过程中出现错误信息 
    NOTICE: PHP message: PHP Warning: PHP Startup: Unable to load dynamic library '/opt/rh/php55/root/usr/lib64/php/modules/scws.so' - libscws.so.1: cannot open shared object file: No such file or directory in Unknown on line 0 
    则需要建两个软连接: 
    ln -s /usr/local/scws/lib/libscws.so.1.1.0 /usr/local/lib/libscws.so 
    ln -s /usr/local/scws/lib/libscws.so.1.1.0 /usr/local/lib/libscws.so.1

  8. 这样就算安装完成了,余下的工作只是PHP代码编写问题了。


使用php扩展:使用方法详见:https://github.com/hightman/scws/blob/master/phpext/README.md

$sh = scws_open();
scws_set_charset($sh, 'utf8');
scws_set_dict($sh, '/usr/local/scws/etc/dict.utf8.xdb');
scws_set_rule($sh, '/usr/local/scws/etc/rules.ini');
$text = "我是一个中国人,我会C++语言,我也有很多T恤衣服";
scws_send_text($sh, $text);
$top = scws_get_tops($sh, 5);
print_r($top);
Array
(
    [0] => Array
        (
            [word] => C++
            [times] => 1
            [weight] => 9.5
            [attr] => nz
        )

    [1] => Array
        (
            [word] => T恤
            [times] => 1
            [weight] => 5.5
            [attr] => n
        )

    [2] => Array
        (
            [word] => 我会
            [times] => 1
            [weight] => 4.9400000572205
            [attr] => r
        )

    [3] => Array
        (
            [word] => 很多
            [times] => 1
            [weight] => 4.9200000762939
            [attr] => m
        )

    [4] => Array
        (
            [word] => 衣服
            [times] => 1
            [weight] => 4.9200000762939
            [attr] => n
        )

)


分享到:

扫描二维码推送至手机访问。

版权声明:本文由云河空间发布,如需转载请注明出处。

本文链接:https://yuyunhe.cn/index.php/post/276.html

分享给朋友:

“Linux系统安装SCWS-1.2.3及PHP扩展” 的相关文章

如何自己手工获取自己的Access Token

如何自己手工获取自己的Access Token

在使用WP2PCS前,你需要了解,WP2PCS目前只支持百度网盘,(将来将支持360网盘和腾讯微云,这要看它们的API什么时候开放, 且容易开发)是基于百度PCS的API开发的,和坊间流传的抓取百度网盘文件直链不同,WP2PCS从百度网盘获取文件的源(二进制流),是百度许可并鼓 励开发者使用的接...

php无限分类-总结

//php代码部分  <?php         header('Content-Type:text/html;charset=utf-8');    ...

git的几个小技巧

git的几个小技巧

分享git的几个小技巧,后面会根据使用补充。目前包括git撤销本地修改、git回退到前n个版本、git多用户提交冲突解决、git 命令简化。欢迎大家补充^_*1、git撤销本地修改 Java git reset --hard origin/ma...

php二维数组转换为一维数组的几种方法

在开发过程中,我们经常需要将二维数组转为一维数组,个人总结了2种方法,分享给大家如何将下面的二维数组转为一维数组。复制代码 代码如下:$msg = array(  array(    'id'=>'45',    'name'=>'...

如何在不同编程语言中获取现在的Unix时间戳(Unix timestamp)

如何在不同编程语言中获取现在的Unix时间戳(Unix timestamp)?先上代码进行java时间转换成unix timestampimport java.text.DateFormat;   import java.text.ParseExceptio...

PHP开发之THINKPHP多表联合查询操作的三种方法

THINKPHP 中关联查询(多表查询)可以使用 table() 方法或和join方法,请看示例: 联合查询         1、原生查询    &...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。