每周一数丨数据+采集规则,免费送!

2019-10-31 13:43:41 浏览:5313
采集网址:

http://www.bio-equip.com/Suppliers.asp?=&page=1

QQ截图20191031133635.png


采集目标:


厂商名称,地区,电话,网站,浏览数


使用工具:
1. 火车采集器
2. Fidder抓包软件
采集成果:

QQ截图20191031133709.png



那么我们接下来看如何用火车采集器来获取法律法规数据。
第一步:打开火车官网 www.locoy.com 下载最新版火车采集器并安装
第二步:


在桌面浏览器中打开列表页网址:

http://www.bio-equip.com/Suppliers.asp?=&page=1 

 

点击下一页,可以看到网址中有页数变化:

http://www.bio-equip.com/Suppliers.asp?=&page=2

 

同时可以观察到需要采集的字段都在列表页页面上显示



QQ截图20191031133836.png

第三步:


那么在采集器中起始网址可以使用批量网址的操作


QQ截图20191031133906.png




打开列表页网址源码,在源码中获取提取内容页网址的字符串:

QQ截图20191031133934.png



同时可以看到需要采集的字段在列表页源码中也存在(且列表页源码中可以看到td位置对应需要采集字段的值),那么就可以直接在列表页中采集

QQ截图20191031134006.png

把所有需要的数据用组合标签在列表页中获取下来,然后在内容页采集规则中细分多个标签中去。


第四步:


把组合标签处理下,让组合标签中的数据只有<td>数据</td>,方便细分标签的提取。

QQ截图20191031134044.png


然后细分标签中使用组合标签,按照td的数量进行提取:比如厂商名称(是第一个td中的值)

QQ截图20191031134115.png



第五步:


比如电话标签(是第三个td中的值)

QQ截图20191031134141.png




每周一数数据以及采集规则领取时间为2019/10/30日发文后5个工作日内。采集规则涉及到商业版本功能,建议用户登录商业版本使用此规则。


数据领取资格:火车采集器/火车浏览器/触控精灵商业版软件用户(服务年限内),如果您不是商业用户或者已经过了服务年限,但也想参与活动的话,可以新购软件或者升级续费,这样就能参与活动啦!通知一下哦,双11火车活动优惠折扣很大呢!活动将于11月1日开始,详情登陆官网:www.locoy.com 查看。


数据领取方式

第一步:扫码添加火车运营微信号,火车运营助手会拉你进入活动群。

微信图片_20191024173419.jpg


第二步:进群后添加数据咨询客服.雅的微信号,经客服验证为服务年限内商业用户身份后,即可领取


好啦,本期的“每周一数”就到这里了。如果您还有想要获取更多的数据资源以及采集器规则的话,可以在文章下方或是公众号后台留言,小采会综合大家的意见选择下一期赠送数据的主题哦!

扫码关注微信