产品上线
2005年
2009正式版
2009年
2010正式版
2010年
v7正式版
2012年
v8正式版
2013年
v9正式版
2015年
v10正式版
2021年
火车采集器 (v10正式版)
软件大小:54.6MB
更新时间:2024-11-05
本软件要求电脑安装.NET4.6框架支持 (下载.NET4.6)
download
更新下载

2024年

  • 2024-11-05

    火车采集器V10.26版
    1.新增:文件上传支持华为云上传
    2.新增:保存为本地TXT文件时,支持自定义扩展名,比如.ini,.py等等
    3.新增:HTML标签过滤排除支持自定义过滤标签
    4.新增:http请求头列表支持剪切板批量粘贴导入头信息设置
    5.新增:POST分页设置支持日期参数[yyyyMMdd]
    6.优化:火车采集器默认UA更新
    7.优化:数据编辑SQL操作界面可随着编辑界面伸缩放大
    8.修复:下载图片探测地址问题修复
    9.修复:html标签过滤时部分标签不起效问题修复
    10.修复:标签提取结果生僻字、繁体字不能查看问题修复
    11.修复:数据获取中调用多个标签作为截取字符不起效问题的修复
    12.修复:数据转换mysql编码设置无效问题修复
  • 2024-03-18

    火车采集器V10.25版
    1.增加:标签文件下载支持添加图片水印。
    2.增加:数据处理中的HTTP请求可以调用请求头信息。
    3.增加:下载增加是否设置Referer为空配置。
    4.增加:批量网址支持文本导入。
    5.增加:水印文字可以调用标签。
    6.增加:获取cookie超时时间。
    7.修复:标签提取结果和下载文件名不一致。
    8.修复:图片地址识别错误导致下载失败。
    9.修复:列表页标签提取结果有空格时不显示。
    10.修复:正则提取时组合结果重复。
    11.修复:数据转换mysql支持修改编码。
    12.优化:远程管理采集数据接口优化。
    13.优化:插件.NET Framework升级到4.6。
    14.优化:网址库支持手动填写与选择。

2023年

  • 2023-08-10

    火车采集器V10.24版
    1.修复:点击欢迎页空白地方页面打不开。
    2.新增:任务批量处理,导入数据支持PageUrl字段导入。
    3.优化:内置浏览器内核升级。
    4.修复:起始网址添加向导中批量网址地址格式显示错误。
    5.新增:任务右键菜单高级操作增加“标记采集状态为已采”。
    6.优化:远程管理自动启动无需在菜单工具栏手动点击。
    7.修复:标签引用“列表页”标签时提取无效。
    8.修复:不排重时列表页重复内容被自动过滤。
    9.新增:对指定标签内容进行AI对话:http://faq.locoy.com/q-1356.html
    10.优化:自动更新cookie丢失的请求重新采集。
  • 2023-03-10

    火车采集器V10.23版
    1.新增:腾讯云cos上传附件功能,教程见:http://faq.locoy.com/q-1354.html
    2.新增:七牛云SDK更新,支持更多区域
    3.新增:支持win11最新系统使用
    4.新增:探测下载增加:不探测直接下载模式,提高下载速度优化下载配置
    5.修复:部分自动转化拼音无效问题处理
    6.修复:strong标签过滤无效问题处理
    7.修复:处理水印切图有边线问题
    8.修复:部分简繁互转无效问题处理
    9.修复:xpath提取缺少标签问题
    10.修复:二级代理http类型账号密码使用问题

2022年

  • 2022-10-12

    火车采集器V10.22版
    1.优化:升级内置微型浏览器内核到谷歌浏览器
    2.优化:Win11中部分采集器无法兼容问题修复
    3.新增:二级代理支持手动填写规则获取代理列表,可以更灵活获取多种格式IP
    4.新增:加入去除图片水印功能平台插件:http://faq.locoy.com/q-1353.html
    5.新增:web发布模块http头信息支持选择生效步骤,提高灵活性,支持更多类型发布网站
    6.修复:部分下载提示未将对象引用至实例
    7.修复:循环时随机数据相关问题
    8.优化:部分ssl3最新https网站的相关兼容性
  • 2022-05-30

    火车采集器V10.21版
    1.新增:ftp支持七牛云上传,http://faq.locoy.com/q-1351.html
    2.新增:标签过滤新增内容日期过滤,http://faq.locoy.com/q-1352.html
    3.新增:文件下载中保存目录和保存格式增加“[从X开始自增ID]”
    4.新增:点击运行管理列表“状态”列可按任务运行状态排序,便于排查任务状态
    5.提升:mysql支持8.0版本
    6.修复:批量网址补0预览无效问题
    7.修复:插件管理器文件下载插件模板增加操作方法
    8.修复:同url文件再次下载时没有入库,导致发布缺少文件问题
    9.修复:设置http请求头refer时文件探测下载生效,正式下载无效问题
    10.修复:web发布模块登录验证码显示不全问题
    11.修复:单次替换和批量替换中的“忽略大小写”设置无效问题
    12.修复:勾选数据管理“已采”时,更改“已发”为勾选问题
  • 2022-02-28

    火车采集器V10.2版
    1.新增:User-Agent支持从文本读取并随机切换。教程:http://faq.locoy.com/q-1348.html。
    2.新增:自动识别手机号功能支持14、15、16、17、19开头的新号段。
    3.优化:文件下载完毕插件接口优化。
    4.优化:探测文件下载时正式下载文件,提升下载速度。
    5.修复:http请求头“Header或设置名”以数字开头的名称报错的问题修复。
    6.修复:发布到word文档,如果数据包含特殊字符或本地图片异常会导致发布失败问题修复。
    7.修复:拷贝任务时,任务备注未拷贝问题修复。
    8.修复:标签引用支持调用“列表页”标签。
    9.修复:json提取时如果json对象的“键”是整型导致提取有误。
    10.优化:网址解析替换html问题。
    11.修复:get、post分页问题处理。
    12.修复:生成固定格式的数据中“系统时间”选中“06-16”生成时间格式“yyyy-MM”
    13.新增:数据库发布模块支持replace into语句。

2021年

  • 2021-10-08

    火车采集器V10.1版
    1.修复:添加了HTTP请求的头信息之后,再添加多页,头信息的所属页会全部清空。
    2.新增:表格类型数据自动分析,自动添加字段,也可以删除字段。自动勾选循环。
    3.修复:复制规则之后,规则排重库处为空白,无法建立新的排重库。
    4.完善:删除任务的时候,同时删除该任务的所有数据,并且在提示信息框加上提示信息。
    5.修复:文件下载jpeg格式自动转换jpg。
    6.优化:提取json时若提取表达式里面属性不存在导致其他数据提取失败。
  • 2021-07-05

    火车采集器V10.0版
    1.数据获取中支持调用其他标签的值作为截取条件。
    2.数据获取支持CSS selector,很多网页的css 的属性唯一,此功能更利于批量从网页中提取数据。
    3.增加关联区域功能,可以截取网页中指定区域内容进行采集处理。
    4.批量网址增加区间变化的网址增加方式,适应更多的网页地址变化方式。
    5.批量设置增加新增加功能的批量设置。
    6.运行统计日志设置添加默认关闭功能,可在设置中选择开启或关闭。
    7.oss相关问题修复。
    8.网址空格问题导致列表页标签错误问题修复。
    9.下载相关问题修复。
    10.修复“任务数据批量处理”中删除为空记录无效的问题。
    11.文件下载插件增加文件下载后处理接口。
  • 2021-03-15

    火车采集器V9.30版
    1.优化标签数据处理中字符替换。
    2.对文件探测无效导致文件下载失败问题优化。
    3.处理用户名包含特殊符号不能登录问题。
    4.修复数据管理批量操作数据有异常弹窗提示。
    5.修复二级代理卡死问题。
    6.完善自动获取cookie失败问题。
    7.发布到word,自动转义"<"、">"为"<"、">"。
    8.修复:勾选发布选项,采集最大数无效。
    9.修复oracle链接问题。
    10.支持oss存储。
    11.修复:下载地址后面有斜杠,下载文件时无后缀名。

2020年

  • 2020-09-07

    火车采集器V9.21版
    1: 自动获取cookie功能优化
    2: 数据库发布增加事务,优化数据库发布速度
    3: 数据转换速度优化(针对Mysql和SqlServer数据库的导入), 同时去除网址库的清空逻辑
    4: html标签处理错误问题处理
    5: json提取关于数字转换为科学计数法问题处理
    6: 发布测试时,图片上传无效的问题处理
    7: 采集内容页处理错误时,增加对于当前出错标签的提示,以便快速定位出错标签
    8: 任务批量编辑,增加可操作范围
    9: 循环匹配匹配空格问题处理
    10: 刷新分组中增加统计数据的刷新
    11: post分页处理
    12: 部分功能逻辑优化
  • 2020-06-15

    火车采集器V9.20版
    1: IE浏览器内核升级
    2: Post分页逻辑优化调整
    3: 火车采集器中各个输入框支持“双击”查看详情,便于操作
    4: 下载逻辑对于图片和附近同时勾选时的逻辑优化
    5: 图片探测请求增加对于插件的支持
    6: 增加自动更新采集cookie功能来更新cookie以及ua(旗舰(自动授权)及以上版本支持)
    7: 发布模块在图片不存在时发布错误的问题修复,以及相应的提示内容调整
    8: 将数据标记为未采时,同时将图片下载信息重新标记
    9:代理定量设置未生效的bug修复。
  • 2020-03-23

    火车采集器V9.13版
    1: 新增数据库导入where条件筛选设置功能
    2: 日志打印相关问题修复
    3: 下载问题修复
    4: 发布模块请求头相关问题修复
    5: 列表页标签相关问题修复
    6: 发布最大超时时间增加
    7: 已生成的网址库修改后则下次不显示问题修复
    8: 未能分析主机名修复
    9: 其他已知问题修复

2019年

  • 2019-12-26

    火车采集器V9.12版
    1: 二级代理页面、功能全面优化调整。
    2: 修复SqlServer数据库下载图片记录错误的问题。
  • 2019-11-21

    火车采集器V9.11版
    1: 列表页新增“地址处理”功能
    2: 新增“请求失败数”的预警条件设置。
    3: 下载图片命名,新增[记录自增Id]格式
    4: 修复图片下载误判断问题
    5: 修复计划任务中“每天调度”,起始运行时间配置未生效的问题。
    6: 修复PHP插件,对于循环记录的处理报错的问题。
    7: 修复拼音首字母对于一些错误字符的判断问题。
    8: 任务批量编辑,修复“发布”中“多网站乱序发布”未能复制的问题
    9: 修改“循环添加新记录”配置后,修复数据格式选择错误的问题。
    10:修复循环记录中列表页标签被多次处理的问题
    11:修复对于一些302跳转地址,无法正确跳转的问题。
    12:修复一些网址无法正确请求的问题
  • 2019-09-05

    火车采集器V9.10版
    1.二级代理重大修改并增加了商业代理支持
    2.post获取网址POST页码增加递增数值
    3.修复php和python插件不支持cookie的问题
    4.当成功失败标识都为空时认为是发布成功
    5.调整发布和入库模块界面大小和操作bug
    6.修复web发布不登录时不发UA的问题
    7.修复web发布测试时超时不起效的问题
    8.修复Web发布时特殊情况下死循环问题
  • 2019-05-07

    火车采集器V9.9版
    1.优化效率修复运行大量任务时运行卡顿问题
    2.修复大量代理时配置文件锁死程序退出问题
    3.修复部分情况下mysql链接不上问题
    4.修复极少云规则规则显示不了的问题
    5.修复ie版本号显示不正常的问题
    6.修复多页处理&问题
    7.搜索增加按任务id搜索功能
    8.修复下载文件filename*=的bug处理
    9.其它界面和功能优化

2018年

  • 2018-12-27

    火车采集器V9.8版
    1: “远程管理” 正式升级为 “私有云”,全面优化调整。
    2: 发布模块增加自定义头信息的增加。
    3: 采集线程间隔调整,增加自定义区间设置。
    4:长时间使用后的运行卡顿问题修复。
    5: 二级代理,IP输入框修改为普通TextBox。增加代理免验证的功能。
    6: 分组丢失、死循环问题修复。
    7: ftp上传,增加超时处理。
  • 2018-10-29

    火车采集器V9.7.1版
    1: Web发布模块,对于登陆数据,增加自定数据的格式。
    2: html标签处理,增加“排除其他标签”的处理方式。
    3: 标签的编辑,增加“多选”模式,实现批量的复制、删除操作,按住ctrl键,即可选择多个标签。
    4: 本地数据库为sqlite时,数据库清空时,增加数据库的压缩操作。
    5: 修复采集器长时间行后导致的程序卡顿问题。
    6: 当有分页的时候,对于标签增加设置提示。
    7: 对于Post分页中的【文本】,增加自定义转义的设置。
    8: 修复同步云端规则,在使用数据库为Mysql或者SqlServer时,未能建立对应规则本地数据库的问题。
    9: 修复循环匹配与添加为新记录的冲突问题。
    10: 修复当登陆参数有随机值,无法自动登陆的问题。
    11: 修复使用Python插件时,空格变成+的问题。
    12: 修复批量复制下,“最大循环次数”未复制的问题,增加起始网址的复制。
    13:修复任务、分组无法拖动到根目录下的问题。
  • 2018-07-19

    火车采集器V9.7版
    1: 添加“重新采集上次请求失败的列表页”功能。
    2: 优化任务发布方式,站群式发布添加支持顺序、倒序发布。
    3: 列表页独立标签,增加“从网址中获取”的选型。
    4: 优化图片地址匹配方式,一些原来无法匹配的图片可以正确匹配了。
    5: 同义词替换,增加对于html标签替换的支持。
    6: 循环采集模式,增加循环次数限制。
    7: 数据发布,增加自定义数据发布模式。
    8: 修复删除列表页时,未能删除对应列表页标签的问题。
    9: 修复使用图片水印时,未选择保存格式导致的水印错误的bug。
    10:Json工具,修复长Json处理时的卡顿问题。
    11:修复采集标签过多导致的任务无法运行的错误。
    12:修复自定义插件编译错误的问题。
    13:修复PHP插件对于循环采集标签处理时的错误问题。
  • 2018-04-09

    火车采集器V9.6.5版
    1: 文本导出时,增加导出文件的编码选择。
    2: 批量导入任务以及导入任务分组时,添加任务导入结果反馈,修复由于一个错误任务导致的全部出错的问题。
    3: 批量内容替换,增加文本导入的功能。
    4: 二级代理自动更换代理优化,在无任务使用二级代理时,不进行代理的自动更换。
    5: 请求头信息,增加适用于全部页面的选择。
    6: HttpPost分页,添加对于[文本]与[分页]进行组合的支持。
    7: 修复清空网址库时,对应的压缩数据未能删除的问题。
    8: 修复图片添加水印时,水印覆盖错误的问题。
    9: 修复批量编辑任务时,内容页“其他设置”未能复制的问题。
    10:存储过程sql验证优化,防止一些正确语句被错误提示的问题。
  • 2018-02-02

    火车采集器V9.6.4版
    1.修复分页采集请求出错的问题
  • 2018-01-26

    火车采集器V9.6.3版
    1: 修复使用PHP插件,无法获取请求cookie的问题。
    2: 批量网址处理中,时间格式增加转换为“时间戳”的功能。
    3: 修复“智能提取电话”功能意外变为“智能提取邮箱”的bug。
    4: 无限极列表页采集,是否由于重复数据而停止修改为可配置(原为自动停止采集)。
    5: 修复老板键设置为空之后,会默认变成 CtrL+Alt的bug。
    6: 修复由于没有水印配置,导致的程序批量复制出错的问题。
    7: 修复由于多页未能获取到,导致由多页获取数据的标签丢失的bug。
    8: 发布模块,数据库的编码增加utf8mb4格式支持。
    9: 修复分页循环匹配时,组合标签仅获取第一页的bug
    10:优化批量网址处理中,由于数据量太多而导致程序卡顿的问题。

2017年

  • 2017-12-12

    火车采集器V9.6.2版
    1:图片水印,添加全覆盖的需求。
    2:发布配置页面,增加配置项的复制、黏贴的功能。
    3:发布规则配置界面,在导入规则后,增加定位跳转功能。
    4:修复文件名自增时,赋值错误的问题。
    5:修复发布页面,列表的滚动条定位的错误问题。
    6:修复先上传,后发布时,本地图片不删除。
    7:修复任务批量编辑时,水印规则未复制的问题。
    8:修复在云端规则获取出错的问题。
    9:修复在某些时候,规则标签配置不生效的问题。
    10:修复自动拨号未实现的问题。
  • 2017-10-26

    火车采集器V9.6.1版
    1: 修复火车采集器与Win10(1709)版本的兼容性问题。
    2: 修复循环添加新纪录时,边采集边发布只发布一条数据的问题。
    3: 修复网址Post参数从文本导入时,由于转义导致的导入出错问题。
    4: 修复代理正则匹配失败,导致的程序退出问题。
  • 2017-09-09

    火车采集器V9.6版
    1: 多级网址列表,对于列表名增加重命名功能以及上下调整的功能。
    2: 修复SqlServer数据库格式下,未能正确显示采集数量的问题。
    3: 修复在新增标签时,若上一个编辑为固定格式数据,则新增的标签显示内容错误的问题。
    4: 修复数据包登录中,若登录失效,未能自动重新登录的问题。
    5: 修复FTP上传失败后,本地数据也被删除的问题。
    6: 修复边采集边发时,文件上传FTP失败的问题。
    7: 优化Excel保存时,对于ID,PageUrl显示列的位置。
    8: 修复任务不能多选操作的问题。
    9: 边采集边发布时,最大发布数的功能调整(原:最大发布数无效。 现:最大发布数生效,且在任务完成后,不会将以前的未发布数据再次发布)
    10:修复对于存储过程语句,当数据为空值时,意外判断为“语句错误”的问题。
    11:二级代理功能,修复定时拨号失效的问题。
    12:二级代理功能,定时获取API功能优化,重新获取时,会自动删除上一批数据。
    13:批量网址增加数据库导入的模式
    14:导出到文件时,对于不合理的错误命名增加提示。
    15:导出规则时,对于规则名称过长的规则,增加提示的功能。
    16:规则编辑时,对于“包含”、“不包含”数据,复制粘贴多行时,会自动区分为多个数据。
    17:添加对于芝麻代理的合作支持。
    18:数据库导入批量网址
  • 2017-06-21

    火车采集器V9.5版
    1: 调整列表页排重的方式,现在仅会在同级列表页之间进行排重。
    2: 增加对于任务运行完毕之后的运行统计的预警功能(Email邮件预警)【旗舰版功能】
    3: 新增支持对于一些请求返回码不为200时,仍然进行采集的配置。
    4: 新增支持将下载地址保存为html文件的功能。
    5: 二次代理服务,增加导入的时候配置代理类型,同时修复对于用户名密码的显示错误问题。
    6: 发布配置页面,默认仅显示当前选择配置,加快任务加载时间。
    7: 修复命令行控制,closeapp参数无法自动关闭程序的问题。
    8: 修复在未选择图片水印时,无法进行图片剪裁的问题。
    9: 优化开始界面加载方式,解决初始化界面卡顿的问题。
    10:修复在配置多行连接符包含“|”导致的无法探测图片下载的问题。
    11:修复Excel导出数据时,列的顺序与字段顺序不一致的问题。
    12:修复Excel导出数据时,一些包含数字的字段的导出数据错误问题。
    13:修复任务批量编辑时,Json采集表达式未能复制的问题。
  • 2017-03-02

    火车采集器V9.4版
    1、修复Win10系统无法登陆采集器的问题。
    2、 修复Https页面无法采集的问题。
    3、修复Mysql数据库,增加标签时,数据库字段不得为空导致的采集数据失败的问题。
    4、修复在任务运行中编辑任务,可能会导致的编辑结果保存失败问题。
    5、 二级代理,通过网页API获取代理,增加定时获取、自动验证的功能。
    6、增加智能提取电话号码的功能。

2016年

  • 2016-11-04

    火车采集器V9.3版
    1,任务增加备注说明,并且可以显示于任务列表中
    2,增加任务完成提示音
    3,Http服务增加单条数据修改api,并且可以于http页面内编辑数据
    4,修复任务编辑时,《保存退出》无效的问题
    5,批量编辑网址中,现在可以支持两个参数同步变化的功能
  • 2016-06-02

    火车采集器V9.2版
    1.修复使用时分页请求间隔无效的问题
    2.修复使用access入库时因系统驱动没安装测试点击没有反应的问题
    3.修复批量复制规则任务的时候多个勾选的问题
    4.Xpath的属性增加Alt,Src等属性

2015年

  • 2015-12-14

    火车采集器V9.1版
    *支持多页的分页采集
    *添加已采字段
    *采内容进度算法调整
    *web获取列表使用分类名+id显示
    *优化实时数据、文件下载数据量显示不全问题
    *修复php插件被当做C#插件禁止使用问题
    *修复POST文本文件路径无法保存问题
    *修复不得包含的多个词的逻辑问题
    *修复本地数据编辑字段过多时无法查看全的问题
    *修复url #之后的内容补全问题
    *修复安装在C盘,管理员权限的问题
    *修复url #之后的内容补全问题
  • 2015-09-17

    火车采集器V9.0版
    1.全新界面,更好的UI及用户体验
    2.新架构、新内核,使用9年的.NET2.0框架升级到.NET4.0框架
    3.支持最新的Win10系统中运行
    4.二级代理服务器新增Socks代理
    5.优化采集流程,大幅提升采集及入库速度
    6.任务运行过程中可修改线程数等参数,实时调节运行速度
    7.支持SSH(SFTP文件)上传
    8.内容提取新增JSON提取方式,提取JSON数据更加简单。
    9.新增C#源码类型插件,可以直接编辑插件源码,实时生效。
    10.软件闪退,支持保存未完成的任务进度
    11.任务运行合并到统一界面,添加“实时数据”查看和“任务详情”统计
    12.列表页,分页,多页自定义任意Header请求头等功能
    13.批量修改任务规则细节参数,批量修改Web发布配置
    14.起始网址批量网址的地址格式可添加多个地址参数,支持自定义列表参数
    15.标签数据来源更细致化,可设置从默认页,分页,多页的源码,URL地址及返回头信息中提取
    16.标签数据处理新增统计标签字符串长度、批量替换功能
    17.修改原有的无限级列表页网址获取模式,无限级配置更加简单
  • 2015-03-23

    火车采集器V8.6版
    1.增加任务自动读取外部cookie功能
    2.采网址部分增加按大小写提取功能
    3.修复导出Word时特殊情况下内容丢失的问题
    4.修复html过滤时ui,li后半部分匹配不正确的问题
    5.增加了同义词实时监控修改功能
    6.修复二级代理部分代理无效的问题
    7.其它bug修复

2014年

  • 2014-12-10

    火车采集器V8.5版
    1.修改软件启动界面,使用更为友好
    2.增加插件异常处理,方便调试插件
    3.运行日志增加任务id
    4.修复非管理员开机启动失败问题
    5.修复任务批量处理非内容标签复制问题
    6.修复“如果为空再次提取”的bug
    7.WECenter的UBB转化功能完善
    8.随机插入功能改进
    9.修复ul,ol等标签带style时无法过滤问题
    10.官方插件模块接口等资源更新
  • 2014-06-18

    火车采集器V8.4版
    1.修复高dpi下采集器登录界面错位的问题
    2.修复中文分词存在的问题
    3.修复任务完成后不能关机的问题
    4.生成Word和Excel可选2007和2003格式
    5.增加任务规则异常报警功能
    6.添加了批量关闭已完成任务窗口功能
    7.修复文件下载中存在的一些问题
    8.修复边采集边发布为excel 无内容的bug
    9.修复二级代理 Session中url的组合错误
    10.升级插件内核心,增加伪原创等插件
  • 2014-04-09

    火车采集器V8.3版
    1.采集器完全支持64位操作系统
    2.更改程序安装方式,使用安装包
    3.使用用户名判断免费版和商业版本
    4.软件不再需要使用管理员权限启动
    5.任务运行完增加数据增量导出功能
    6.删除内置中文英翻译功能
    7.开放Sqlite存储功能给免费版用户
  • 2014-02-24

    火车采集器V8.2版
    1.增加自助授权版本,不再绑定一台电脑
    2.修复部分退出问题,软件稳定性提高
    3.修复部分2003系统下输入法异常的问题
    4.增加智能提取时间功能
    5.如果内容为空,则不补全单个网址
    6.修复语法日期表达式中的错误

2013年

2012年

2011年

2009年

X
使用人数最多的采集软件,免费版申请、商业版购买及其他数据采集问题请与我们联系咨询
立即咨询