推广 热搜: 公司  快速  中国  上海  未来    企业  政策  教师  系统 

快速搭建自己的搜索引擎

   日期:2024-11-02     作者:caijiyuan    caijiyuan   评论:0    移动:http://kaire.xrbh.cn/news/9835.html
核心提示:以前用过Nutch,爬虫还是很厉害,配起来有各种问题,时间紧,找个简单的。迅搜,http://www.xunsearch.com/我不懂搜索引擎,有需

以前用过Nutch,爬虫还是很厉害,配起来有各种问题,时间紧,找个简单的。

快速搭建自己的搜索引擎

迅搜,http://www.xunsearch.com/

我不懂搜索引擎,有需求说要快速搭建一个搜索引擎,并将指定的搜索结果靠前显示,找到了这个。

安装配置很简单,不多说,看:

http://www.xunsearch.com/doc/php/guide/start.installation

因为只有两个小时时间,我就用了它的demo示例。

默认安装完的目录:

/usr/local/xunsearch

启动服务:

/usr/local/xunsearch/bin/xs-ctl.sh start

切到下面目录:

/usr/local/xunsearch/sdk/php

编辑demo示例,因为没有url,demo没法跳转,添加之。。。

vi app/demo.ini

编辑csv文件,准备导入数据,chrono是时间戳

找了半天,没找到怎么从网上爬数据,时间紧迫,改为导入数据。

// 清除原有数据

util/Indexer.php --clean demo

// 将新建的csv文件导入demo实例

util/Indexer.php --source=csv --file=/usr/local/xunsearch/sdk/php/12345.csv demo

// 生成web访问文件

php util/SearchSkel.php demo /var/www/html

生成后访问:search.php

打开很慢,看是引用了google的js,上拉登,把js 和css down到本地,修改search.tpl引用。

打开search.tpl,找到标题显示部分,修改a的href为 url,如下:

<a href="https://www.cnblogs.com/dwj192/p/<?php echo $doc->url; ?>" target="_blank"><h4><?php echo $doc->rank(); ?>. <?php echo $search->highlight(htmlspecialchars($doc->subject)); ?> <small>[<?php echo $doc->percent(); ?>%]</small></h4></a>

其它:收录时间,是时间戳,格式化为标准时间格式,时间戳弄起来很费劲,我直接写了随机数,固定时间输出是用户要求

<span><strong>收录时间:</strong>
<?php
if(htmlspecialchars($doc->url) == 'http://123.com/'){
echo '2011-02-21';
}else{
echo '201'.rand(5,7).'-'.sprintf("%02d", rand(1,12)).'-'.sprintf("%02d", rand(1,28));
}
?></span>

再改改logo、版权啥的,上线(成吉思)。。。

本文地址:http://syank.xrbh.cn/news/9835.html    迅博思语资讯 http://syank.xrbh.cn/ , 查看更多
 
 
更多>同类资讯
0相关评论

新闻列表
企业新闻
推荐企业新闻
推荐图文
推荐资讯
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  粤ICP备2023022329号