2024年
-
2024-11-05
- 火车采集器V10.26版
-
1.新增:文件上传支持华为云上传
2.新增:保存为本地TXT文件时,支持自定义扩展名,比如.ini,.py等等
3.新增:HTML标签过滤排除支持自定义过滤标签
4.新增:http请求头列表支持剪切板批量粘贴导入头信息设置
5.新增:POST分页设置支持日期参数[yyyyMMdd]
6.优化:火车采集器默认UA更新
7.优化:数据编辑SQL操作界面可随着编辑界面伸缩放大
8.修复:下载图片探测地址问题修复
9.修复:html标签过滤时部分标签不起效问题修复
10.修复:标签提取结果生僻字、繁体字不能查看问题修复
11.修复:数据获取中调用多个标签作为截取字符不起效问题的修复
12.修复:数据转换mysql编码设置无效问题修复
-
2024-03-18
- 火车采集器V10.25版
-
1.增加:标签文件下载支持添加图片水印。
2.增加:数据处理中的HTTP请求可以调用请求头信息。
3.增加:下载增加是否设置Referer为空配置。
4.增加:批量网址支持文本导入。
5.增加:水印文字可以调用标签。
6.增加:获取cookie超时时间。
7.修复:标签提取结果和下载文件名不一致。
8.修复:图片地址识别错误导致下载失败。
9.修复:列表页标签提取结果有空格时不显示。
10.修复:正则提取时组合结果重复。
11.修复:数据转换mysql支持修改编码。
12.优化:远程管理采集数据接口优化。
13.优化:插件.NET Framework升级到4.6。
14.优化:网址库支持手动填写与选择。
2023年
-
2023-08-10
-
2023-03-10
2022年
-
2022-10-12
-
2022-05-30
- 火车采集器V10.21版
-
1.新增:ftp支持七牛云上传,http://faq.locoy.com/q-1351.html
2.新增:标签过滤新增内容日期过滤,http://faq.locoy.com/q-1352.html
3.新增:文件下载中保存目录和保存格式增加“[从X开始自增ID]”
4.新增:点击运行管理列表“状态”列可按任务运行状态排序,便于排查任务状态
5.提升:mysql支持8.0版本
6.修复:批量网址补0预览无效问题
7.修复:插件管理器文件下载插件模板增加操作方法
8.修复:同url文件再次下载时没有入库,导致发布缺少文件问题
9.修复:设置http请求头refer时文件探测下载生效,正式下载无效问题
10.修复:web发布模块登录验证码显示不全问题
11.修复:单次替换和批量替换中的“忽略大小写”设置无效问题
12.修复:勾选数据管理“已采”时,更改“已发”为勾选问题
-
2022-02-28
- 火车采集器V10.2版
-
1.新增:User-Agent支持从文本读取并随机切换。教程:http://faq.locoy.com/q-1348.html。
2.新增:自动识别手机号功能支持14、15、16、17、19开头的新号段。
3.优化:文件下载完毕插件接口优化。
4.优化:探测文件下载时正式下载文件,提升下载速度。
5.修复:http请求头“Header或设置名”以数字开头的名称报错的问题修复。
6.修复:发布到word文档,如果数据包含特殊字符或本地图片异常会导致发布失败问题修复。
7.修复:拷贝任务时,任务备注未拷贝问题修复。
8.修复:标签引用支持调用“列表页”标签。
9.修复:json提取时如果json对象的“键”是整型导致提取有误。
10.优化:网址解析替换html问题。
11.修复:get、post分页问题处理。
12.修复:生成固定格式的数据中“系统时间”选中“06-16”生成时间格式“yyyy-MM”
13.新增:数据库发布模块支持replace into语句。
2021年
-
2021-10-08
-
2021-07-05
- 火车采集器V10.0版
-
1.数据获取中支持调用其他标签的值作为截取条件。
2.数据获取支持CSS selector,很多网页的css 的属性唯一,此功能更利于批量从网页中提取数据。
3.增加关联区域功能,可以截取网页中指定区域内容进行采集处理。
4.批量网址增加区间变化的网址增加方式,适应更多的网页地址变化方式。
5.批量设置增加新增加功能的批量设置。
6.运行统计日志设置添加默认关闭功能,可在设置中选择开启或关闭。
7.oss相关问题修复。
8.网址空格问题导致列表页标签错误问题修复。
9.下载相关问题修复。
10.修复“任务数据批量处理”中删除为空记录无效的问题。
11.文件下载插件增加文件下载后处理接口。
-
2021-03-15
2020年
-
2020-09-07
-
2020-06-15
-
2020-03-23
2019年
-
2019-12-26
-
2019-11-21
- 火车采集器V9.11版
-
1: 列表页新增“地址处理”功能
2: 新增“请求失败数”的预警条件设置。
3: 下载图片命名,新增[记录自增Id]格式
4: 修复图片下载误判断问题
5: 修复计划任务中“每天调度”,起始运行时间配置未生效的问题。
6: 修复PHP插件,对于循环记录的处理报错的问题。
7: 修复拼音首字母对于一些错误字符的判断问题。
8: 任务批量编辑,修复“发布”中“多网站乱序发布”未能复制的问题
9: 修改“循环添加新记录”配置后,修复数据格式选择错误的问题。
10:修复循环记录中列表页标签被多次处理的问题
11:修复对于一些302跳转地址,无法正确跳转的问题。
12:修复一些网址无法正确请求的问题
-
2019-09-05
-
2019-05-07
2018年
-
2018-12-27
-
2018-10-29
- 火车采集器V9.7.1版
-
1: Web发布模块,对于登陆数据,增加自定数据的格式。
2: html标签处理,增加“排除其他标签”的处理方式。
3: 标签的编辑,增加“多选”模式,实现批量的复制、删除操作,按住ctrl键,即可选择多个标签。
4: 本地数据库为sqlite时,数据库清空时,增加数据库的压缩操作。
5: 修复采集器长时间行后导致的程序卡顿问题。
6: 当有分页的时候,对于标签增加设置提示。
7: 对于Post分页中的【文本】,增加自定义转义的设置。
8: 修复同步云端规则,在使用数据库为Mysql或者SqlServer时,未能建立对应规则本地数据库的问题。
9: 修复循环匹配与添加为新记录的冲突问题。
10: 修复当登陆参数有随机值,无法自动登陆的问题。
11: 修复使用Python插件时,空格变成+的问题。
12: 修复批量复制下,“最大循环次数”未复制的问题,增加起始网址的复制。
13:修复任务、分组无法拖动到根目录下的问题。
-
2018-07-19
- 火车采集器V9.7版
-
1: 添加“重新采集上次请求失败的列表页”功能。
2: 优化任务发布方式,站群式发布添加支持顺序、倒序发布。
3: 列表页独立标签,增加“从网址中获取”的选型。
4: 优化图片地址匹配方式,一些原来无法匹配的图片可以正确匹配了。
5: 同义词替换,增加对于html标签替换的支持。
6: 循环采集模式,增加循环次数限制。
7: 数据发布,增加自定义数据发布模式。
8: 修复删除列表页时,未能删除对应列表页标签的问题。
9: 修复使用图片水印时,未选择保存格式导致的水印错误的bug。
10:Json工具,修复长Json处理时的卡顿问题。
11:修复采集标签过多导致的任务无法运行的错误。
12:修复自定义插件编译错误的问题。
13:修复PHP插件对于循环采集标签处理时的错误问题。
-
2018-04-09
- 火车采集器V9.6.5版
-
1: 文本导出时,增加导出文件的编码选择。
2: 批量导入任务以及导入任务分组时,添加任务导入结果反馈,修复由于一个错误任务导致的全部出错的问题。
3: 批量内容替换,增加文本导入的功能。
4: 二级代理自动更换代理优化,在无任务使用二级代理时,不进行代理的自动更换。
5: 请求头信息,增加适用于全部页面的选择。
6: HttpPost分页,添加对于[文本]与[分页]进行组合的支持。
7: 修复清空网址库时,对应的压缩数据未能删除的问题。
8: 修复图片添加水印时,水印覆盖错误的问题。
9: 修复批量编辑任务时,内容页“其他设置”未能复制的问题。
10:存储过程sql验证优化,防止一些正确语句被错误提示的问题。
-
2018-02-02
-
2018-01-26
- 火车采集器V9.6.3版
-
1: 修复使用PHP插件,无法获取请求cookie的问题。
2: 批量网址处理中,时间格式增加转换为“时间戳”的功能。
3: 修复“智能提取电话”功能意外变为“智能提取邮箱”的bug。
4: 无限极列表页采集,是否由于重复数据而停止修改为可配置(原为自动停止采集)。
5: 修复老板键设置为空之后,会默认变成 CtrL+Alt的bug。
6: 修复由于没有水印配置,导致的程序批量复制出错的问题。
7: 修复由于多页未能获取到,导致由多页获取数据的标签丢失的bug。
8: 发布模块,数据库的编码增加utf8mb4格式支持。
9: 修复分页循环匹配时,组合标签仅获取第一页的bug
10:优化批量网址处理中,由于数据量太多而导致程序卡顿的问题。
2017年
-
2017-12-12
-
2017-10-26
-
2017-09-09
- 火车采集器V9.6版
-
1: 多级网址列表,对于列表名增加重命名功能以及上下调整的功能。
2: 修复SqlServer数据库格式下,未能正确显示采集数量的问题。
3: 修复在新增标签时,若上一个编辑为固定格式数据,则新增的标签显示内容错误的问题。
4: 修复数据包登录中,若登录失效,未能自动重新登录的问题。
5: 修复FTP上传失败后,本地数据也被删除的问题。
6: 修复边采集边发时,文件上传FTP失败的问题。
7: 优化Excel保存时,对于ID,PageUrl显示列的位置。
8: 修复任务不能多选操作的问题。
9: 边采集边发布时,最大发布数的功能调整(原:最大发布数无效。 现:最大发布数生效,且在任务完成后,不会将以前的未发布数据再次发布)
10:修复对于存储过程语句,当数据为空值时,意外判断为“语句错误”的问题。
11:二级代理功能,修复定时拨号失效的问题。
12:二级代理功能,定时获取API功能优化,重新获取时,会自动删除上一批数据。
13:批量网址增加数据库导入的模式
14:导出到文件时,对于不合理的错误命名增加提示。
15:导出规则时,对于规则名称过长的规则,增加提示的功能。
16:规则编辑时,对于“包含”、“不包含”数据,复制粘贴多行时,会自动区分为多个数据。
17:添加对于芝麻代理的合作支持。
18:数据库导入批量网址
-
2017-06-21
- 火车采集器V9.5版
-
1: 调整列表页排重的方式,现在仅会在同级列表页之间进行排重。
2: 增加对于任务运行完毕之后的运行统计的预警功能(Email邮件预警)【旗舰版功能】
3: 新增支持对于一些请求返回码不为200时,仍然进行采集的配置。
4: 新增支持将下载地址保存为html文件的功能。
5: 二次代理服务,增加导入的时候配置代理类型,同时修复对于用户名密码的显示错误问题。
6: 发布配置页面,默认仅显示当前选择配置,加快任务加载时间。
7: 修复命令行控制,closeapp参数无法自动关闭程序的问题。
8: 修复在未选择图片水印时,无法进行图片剪裁的问题。
9: 优化开始界面加载方式,解决初始化界面卡顿的问题。
10:修复在配置多行连接符包含“|”导致的无法探测图片下载的问题。
11:修复Excel导出数据时,列的顺序与字段顺序不一致的问题。
12:修复Excel导出数据时,一些包含数字的字段的导出数据错误问题。
13:修复任务批量编辑时,Json采集表达式未能复制的问题。
-
2017-03-02
2015年
-
2015-12-14
-
2015-09-17
- 火车采集器V9.0版
-
1.全新界面,更好的UI及用户体验
2.新架构、新内核,使用9年的.NET2.0框架升级到.NET4.0框架
3.支持最新的Win10系统中运行
4.二级代理服务器新增Socks代理
5.优化采集流程,大幅提升采集及入库速度
6.任务运行过程中可修改线程数等参数,实时调节运行速度
7.支持SSH(SFTP文件)上传
8.内容提取新增JSON提取方式,提取JSON数据更加简单。
9.新增C#源码类型插件,可以直接编辑插件源码,实时生效。
10.软件闪退,支持保存未完成的任务进度
11.任务运行合并到统一界面,添加“实时数据”查看和“任务详情”统计
12.列表页,分页,多页自定义任意Header请求头等功能
13.批量修改任务规则细节参数,批量修改Web发布配置
14.起始网址批量网址的地址格式可添加多个地址参数,支持自定义列表参数
15.标签数据来源更细致化,可设置从默认页,分页,多页的源码,URL地址及返回头信息中提取
16.标签数据处理新增统计标签字符串长度、批量替换功能
17.修改原有的无限级列表页网址获取模式,无限级配置更加简单
-
2015-03-23
2014年
-
2014-12-10
-
2014-06-18
-
2014-04-09
-
2014-02-24