python参考资料,python博客网站

  python参考资料,python博客网站

  源代码介绍:

  适用范围:百度云网盘搜索引擎源代码,百度搜索引擎源代码,网盘搜索爬虫源代码

  演讲地址:(以截图为准)

  运行环境:PHP,MYSQL

  注:分享的源代码是一个搜索引擎,百度云盘爬虫源代码,Python百度云盘搜索引擎,爬虫网站,搜索引擎使用Xunsearch进行高效搜索。源码很简单,有安装教程,可以打开两次。在这里,我爱免费分享,全自动更新百度云盘内容,全自动收藏!

  #爱百赢-百度云搜索引擎,安装部署教程

  # #运行环境

  开始之前,您需要安装

  * PHP 5.3.7

  * MySQL

  * Python 2.7 ~

  *[Xun search](http://xunsearch.com/)搜索引擎

  # #获取源代码

  ```

  git克隆git @ github . com:k 1995/Baidu yun spider . git

  ```

  或者手动下载。

  ```

  https://github.com/k1995/BaiduyunSpider/archive/master.zip

  ```

  下载后,项目目录结构大致如下

  ```

  -索引器/#索引

  -蜘蛛/#爬虫

  - sql/

  - web/#网站

  -应用/

  - config/#与配置相关

  config.php

  -database.php #数据库配置

  .

  .

  - static/# store静态资源,cssjsfont

  -系统/

  index.php

  .

  ```

  # #开始部署

  # # #创建数据库

  创建一个名为“pan”的数据库,编码设置为“UTF-8”。然后导入“SQL”来完成表的创建。

  # # #网站部署

  支持nginx,apache服务器。

  __apache__需要打开*mod_rewrite*。

  __nginx__的配置如下

  ```

  位置/

  {

  索引index.php;

  try _ files $ uri $ uri//index . PHP/$ uri;

  }

  地点~【^/]\.php(/$)

  {

  fastcgi _ pass 127 . 0 . 0 . 1:9000;

  fastcgi _ index index.php;

  包括fastcgi.conf

  包含pathinfo.conf

  }

  ```

  # # # #配置文件修改

  ` config.php 文件修改网站标题、描述等信息。

   Database.php 修改数据库账号,密码等信息。

  网站是基于CodeIgniter框架开发的。如果安装、部署或二次开发有问题,请参考【官网文档】(http://codeigniter.org.cn/user_guide/general/welcome.html)

  # # #启动爬虫

  进入“spider/”目录,修改spider.py中的数据库信息。

  _ _如果您是第一次部署,您需要运行以下命令来完成种子设定_ _

  ```

  python spider.py - seed-user

  ```

  其实以上就是抓取百度云热门分享用户的相关信息,然后开始从他们那里抓取数据。

  那就跑。

  ```

  python spider.py

  ```

  这时,爬虫已经开始工作了。

  # # #安装xunsearch

  目前使用__xunsearch__作为搜索引擎,稍后将替换为elasticsearch。

  请参考安装流程(不需要安装,PHP SDK,我已经集成到web里了)

  http://xunsearch.com/doc/php/guide/start.installation

  # # #索引数据

  以上,我们已经完成了爬虫的数据抓取和网站建设,但是还不能搜索。让我们开始最后一步,指数的建立。

  转到“indexer/”目录,在“indexer.php”中将$前缀替换为您的网站的根路径

  ```

  需要 $ prefix/application/helpers/xs/lib/xs . PHP ;

  ```

  并修改数据库帐户密码。

  那就跑。

  ```

  python。/index.php

  ```

  到目前为止,所有的程序都已安装完毕。如有疑问,欢迎发帖至【github中文社区】(http://www.githubs.cn/topic/118)。

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: