https://www.youlai.cn/dise/
1. 获取”内科”下全部的”疾病”内容页地址
2. 内容页采集字段:疾病名称,挂号科室,相关症状,相关医院的名称及联系方式
正常获取后内容页地址后,处理采集的标签字段
①打开”相关医院”可以看到是一个有上下页的列表,每一行数据中都有需要采集的”医院名称”和”联系电话”
1. 通过查看源码,对比页面数据存在于源码中的什么位置,来设置获取方式,
2. 关联多页的设置要注意实际地址的获取方式,
每周一数数据以及采集规则领取时间为2019/11/21日发文后5个工作日内。采集规则涉及到商业版本功能,建议用户登录商业版本使用此规则。
数据领取资格:火车采集器/火车浏览器/触控精灵商业版软件用户(服务年限内),如果您不是商业用户或者已经过了服务年限,但也想参与活动的话,可以新购软件或者升级续费,这样就能参与活动啦!
数据领取方式:
第一步:扫码添加火车运营微信号,火车运营助手会拉你进入活动群。
第二步:进群后添加数据咨询客服.雅的微信号,经客服验证为服务年限内商业用户身份后,即可领取。
好啦,本期的“每周一数”就到这里了。如果您还有想要获取更多的数据资源以及采集器规则的话,可以在文章下方或是公众号后台留言,小采会综合大家的意见选择下一期赠送数据的主题哦!