当前位置:豆豆首页 > 源码下载 > PHP源码 > 新闻文章

小蜜蜂采集器 V1.619

  • 授权方式:免费源码
  • 运行环境:PHP+MYSQL
  • 源码大小:1757 KB
  • 开发厂商:Home Page
  • 整理时间:2006-06-25
  • 下载统计:399
  • 推荐等级:
  • 下载帮助:
 
U 软件简介
更新说明:
V1.619 释放时间:06.06.19 12:45
本次功能升级针对文章采集模块,增加诸多强劲功能。
1、文章采集:增加采集内容替换功能,用户可设置替换规则随意替换;
2、文章采集:目标链接地址定义支持多规则,降低因目标站使用多种链接标志防采导致采集链接不完整几率;
3、文章采集:增加列表页URL地址步长值设置,可采集非简单加1增长的URL地址;
4、文章采集:内容规则定义增加多规则支持,灵活运用可采集某些通过设置多套显示模版来防采的目标;
5、文章采集:增加html标签过滤设置,允许采集到的内容仅保留必要的html标签甚至无任何html标签的纯文本,降低过滤难度;
6、文章采集:内容分页规则定义增加替换功能,可获取某些通过JS或后台程序变换真实地址的内容分页链接;
7、文章采集:增加内容写入功能,用户可设置任意内容(如自己的链接、广告代码),写入到所采集内容的:最前面、最后面,或者随机写入;导库时自动带上需要写入的内容,无需修改您WEB系统的模版。
8、内容导库规则模版:增加PHPCMS 3.0 数据库直导规则;
9、修正部分显示模版的设置。

小蜜蜂采集器:文章采集、图片采集、Flash采集利器、BBS论坛采集利器
欢迎使用不受目标语言限制、不选存储对象数据库的在线采集器,Google、Baidu搜索排名第一,完全免费,放心使用。

软件应用环境:支持PHP+Mysql+ZEND Optimizer的WEB系统
旧版本用户升级请参考升级文件目录下说明文件操作!!!

适用范围:
1、采集目标不限,无所谓HTML、PHP、ASP、JAVA页面;
2、采集对象支持:文章、图片、Flash;
3、完美的内容入库解决方案,小蜜蜂采集器提供2种入库方式:数据库直导和模拟提交。
1)数据库直导方式支持任何基于Mysql数据库存储信息的内容管理系统;
2)模拟提交方式理论上支持任何目标,不受目标程序语言、数据库类别限制;实际使用效果受目标应用程序影响。

各采集模块功能简介:
1、 文章采集模块 专门采集文章/图片,也可采集文章中附带的flash,但是功能不如Flash采集模块强大;
2、 BBS论坛采集模块 专门采集BBS论坛内容;
3、 Flash采集模块 专门采集flash小游戏,可完美采集缩略图、游戏简介;

采集内容导库简介:各模块采集的内容均可自由导入CMS文章系统、BBS论坛系统

功能介绍:
1、支持文章内容分页采集;
2、支持论坛采集
3、支持UTF-8转换到GB2312,可采集内容字符格式为UTF-8的目标;
4、支持把文章内容保存到本地;
5、支持站点+栏目管理方式,使采集管理一目了然;
6、支持链接替换、分页链接替换,破解某些使用JS/后台程序设置的防采功能;
7、支持采集器设置无限过滤功能;
8、支持图片采集保存到本地,自动替换文件名避免重复;
9、支持FLASH文件采集保存到本地,自动替换文件名避免重复;
10、支持限制PHP FOPEN、FSOCKET函数功能的虚拟主机;
11、支持采集结果人工筛选,并提供“空标题、空内容”的快速过滤删除;
12、支持Flash专业站采集,专门采集flash小游戏,可完美采集缩略图、游戏简介;
13、支持全站配置规则导入、导出;
14、支持栏目配置规则导入、导出,提供规则复制功能简化设置;
15、提供导库规则导入、导出;
16、支持自定义采集间隔时间,避免被误认为DDOS攻击而拒绝响应,可采集设置了防DDOS攻击的网站;
17、支持自定义入库间隔时间,躲避虚拟主机并发数限制;
18、支持自定义内容写入,用户可设置任意内容(如自己的链接、广告代码),写入到所采集内容的:最前面、最后面,或者随机写入;导库时自动带上需要写入的内容,无需修改您WEB系统的模版。
19、支持采集内容替换功能,用户可设置替换规则随意替换;
20、支持html标签过滤,允许采集到的内容仅保留必要的html标签甚至无任何html标签的纯文本;
21、支持多种CMS导库
  程序包内含PHPCMS V2/V3、DedeCms(织梦) V2/V3、PHP168 CMS、mephpcms、Mambo CMS、Joomla CMS系统导库规则及操作指南说明;
22、支持PHPWIND、Discuz论坛导库,程序包内含2大论坛导库规则及操作指南说明;
23、附带数据库优化工具,减少频繁采集数据碎片过多降低数据库性能。

以下特殊功能仅“小蜜蜂采集器”拥有:
1、支持采集过程断点续采功能,不受浏览器意外关闭影响,重新启动后不会重复采集;
2、支持自动对比过滤功能,对已采集的链接系统不会进行重复采集和入库;
  以上两条功能可大幅度减少采集时间,降低系统负载。
3、支持系统每日自动创建图片保存目录,方便管理;
4、支持采集/导库间隔时间设置,避免被目标站识别为流量攻击而拒绝响应;
5、支持自定义内容写入,达到简单防采功能;
6、支持html标签过滤,近乎完美的显示您想要的采集效果;
7、完美的内容入库解决方案,不受目标程序语言、数据库类别限制。

以上众多强劲功能给您免费使用,即刻安装使用体验信息采集的轻松、高效。

----------------------------
选择小蜜蜂采集器的好处:
1、小蜜蜂程序采用PHP开发支持跨平台运行,无论Windows还是Unix类操作系统都可运行,是一个高效采集、完美入库的在线应用软件。
2、小蜜蜂不受安装地点限制,家里、单位电脑、网站服务器都可以;推荐直接安装在网站服务器上运行,更能体会小蜜蜂超强功能和方便之处。
3、采用服务器安装,可将采集的图片/Flash直接抓取到本机使用;无需像其他采集器采集到个人电脑还要将数据FTP上传服务器。试想如果您当天采集图片、Flash超过100M,上传时间是个什么概念。
4、采用服务器安装,可快速进行采集内容导入CMS文章系统或BBS论坛系统;若您使用非在线的采集器,远程入库或上传SQL文件来入库都会浪费时间。
5、小蜜蜂独有的断点续采、重复采集过滤功能,更能节约您制作内容时间。
 
正在加载评论...
请您留言
网友昵称: 匿名发表(无需注册)
 
请输入验证码:  
如果您还不是豆豆会员,欢迎注册
 
请您注意
· 遵守国家有关法律、法规,尊重网上道德,承担一切因您的行为而直接或间接引起的法律责任。
· 豆豆网拥有管理笔名和留言的一切权利。
◇ 为了达到最快的下载速度,推荐使用工具下载本站源码。
◇ 如果您发现该源码不能下载,请点击这里进行报告,谢谢!
◇ 如果您发现该源码有不良信息,请点击这里进行举报,谢谢支持!
◇ 如果您制作了好的源码希望能与大家分享,我们愿意和您一起宣传!投稿请点击这里
◇ 未经本站明确许可,任何网站不得盗链及抄袭本站资源
错误报告 | 网站律师 | 版权申明 | 广告服务 | 友情链接 | 网站地图 | ©所有版权归豆豆技术 蜀ICP备05002354号