价格: ¥ 29.8 积分可抵¥ 1
最后更新: 2020-06-02 12:01:59
演示地址: 点击查看
安装费: 免费
2016最新百度云网盘搜索引擎源码,附带Python爬虫+PHP网站+Xunsearch搜索引擎,Python百度云网盘搜索引擎,爬虫+网站,搜索引擎采用Xunsearch高效搜索,源码很简单,附带安装教程,可二开,全自动更新百度云盘内容,全自动采集哦!许多人都再找的源码。
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
# 爱百应 - 百度云搜索引擎,安装部署教程
## 运行环境
开始之前你需要安装
* PHP 5.3.7 +
* MySQL
* Python 2.7 ~
* [xunsearch](http://xunsearch.com/) 搜索引擎
## 获取源码
git clone git@github.com:k1995/BaiduyunSpider.git
或手动下载
https://github.com/k1995/BaiduyunSpider/archive/master.zip
下载完毕后,___项目的目录结构___大致是这样的
--- indexer/ #索引
--- spider/ #爬虫
--- sql/
--- web/ #网站
--- application/
--- config/ # 配置相关
--- config.php
--- database.php # 数据库配置
...
...
--- static/ # 存放静态资源,css|js|font
--- system/
--- index.php
...
## 开始部署
### 创建数据库
创建名为pan的数据库,编码设为utf-8。然后导入sql,完成表的创建。
### 网站部署
支持nginx,apache 服务器。
__apache__ 需要开启 *mod_rewrite* 。
__nginx__ 配置如下
location /
{
index index.php;
try_files $uri $uri/ /index.php/$uri;
}
location ~ [^/]\\.php(/|$)
{
fastcgi_pass 127.0.0.1:9000;
fastcgi_index index.php;
include fastcgi.conf;
include pathinfo.conf;
}
#### 配置文件修改
config.php 文件修改网站标题,描述等信息
database.php 修改数据库账号,密码等信息
> 网站是基于CodeIgniter 框架开发的,如安装,部署,或二次开发有问题,请参考[官网文档]( http://codeigniter.org.cn/user_guide/general/welcome.html)
### 启动爬虫
进入 spider/目录,修改spider.py 中数据库信息。
__如果你是第一次部署,需运行下面命令,完成做种__
python spider.py --seed-user
上面其实就是抓取百度云热门分享用户的相关信息,然后从他们开始入手爬取数据
然后运行
python spider.py
此时爬虫已经开始工作了
### 安装xunsearch
目前使用__xunsearch__作为搜索引擎,后面会更换为elasticsearch。
安装过程请参考(不需要安装,PHP SDK,我已经整合到web里了)
http://xunsearch.com/doc/php/guide/start.installation
### 索引数据
上面我们完成了爬虫的数据抓取,网站的搭建,但还不能搜索,下面开始最后一步,索引的建立。
进入 indexer/目录,在indexer.php中将$prefix,替换为你web的根路径
require ’$prefix/application/helpers/xs/lib/XS.php’;
并修改数据库账号密码
然后运行
python ./index.php
到此为止程序已全部安装完毕
0 (0%) 好评 | 0 (0%) 中评 | 0 (0%) 差评 |