火车采集器V7.0正式发布
让大家久等了。新版本火车采集器经过一年的开发,终于和大家见面了。新版本对程序进行了完全的重构,升级为全新的采集平台。软件也更名为 火车头数据采集平台 。火车采集器是火车头数据采集平台的默认扩展。以后大家可以在该平台上运行论坛采集器,微博采集器,站群客户端,XX采集器。企业用户还可以使用我们提供的API,开发有自己特色的采集器在平台上使用。
新版本添加的功能有:
1、无限级多页采集,可以实现无限深度的采集
2、任务队列运行管理,支持Cron表达式
3、无限级分组任务管理,任务回收站功能
4、RSS地址采集功能
5、列表页分页采集获取功能
6、列表页附加参数获取功能
7、列表页及标签XPath可视化提取功能
8、标签纯正则替换功能
9、Http接口管理采集器运行
10、导出记录为单个或多个Txt、html 文件
11、标签间自由组合功能
12、针对标签内容继续发送Http请求功能
13、无限级列表网址采集
14、从Http头信息中获取数据
15、标题内容正文提取功能
16、Aspx列表分页自识别
17、多网站站群式web发布
18、导出记录为Word格式
19、导出所有记录为Excel格式
20、使用随机二级代理服务器(支持Socket代理)
21、多扩展间数据交换功能
22、下载的图片自动加增强型水印功能
23、Ocr识别(图片转化为文字)
24、Mongodb数据库保存数据
25、主从服务器分布式采集
26、内置浏览器Cookie获取功能增强
27、任务列表树支持无限级分组
28、Web发布和数据库入库支持插件功能
29、起始网址支持等差等比数列
修改的功能和修复的问题限于篇幅问题就不一一列出了。
安装使用:下载软件包解压后直接运行 LocoyPlatform.exe启动软件,(保证您的电脑安装有.net2.0框架,vista及win7系统用户可能会提示请求管理员权限,请放行)。
升级:若要从3.2sp5,2008,2009或2010版直接升级到火车头数据采集平台1.0版,请运行程序目录下的 UpdateTo7.0.exe,按提示进行升级即可。升级程序不会对原来的数据进行任何的修改,但为了防止用户误操作,请在升级前备份旧版本数据和配置。备份方法是将原采集器完整复制一份。
商业版:商业版用户请从商业用户通道,会员中心,论坛商业用户区版块下载到统一的商业版软件,使用用户名或密码登录软件,如果您的升级服务期限在2012-02-20后,则可以免费升级到V7版并使用。
下载链接:
【免费版】http://www.locoy.com/Down/LocoySpider/LocoySpiderV7.html
【商业版】请登录会员中心[ http://www.locoy.com/member/licencemgr.php]或在论坛商业用户区下载