今天分享给大家安居客网站小区信息采集规则,今天的规则主要用到抓包工具分析房源数量的网址,并使用多页功能拼接出数据网址。大家可以看下面的案例讲解来学习!
【东哥福利】今天分享给大家安居客网站小区信息采集规则,今天的规则主要用到了使用抓包工具分析到房源数量的网址,并使用多页功能拼接出数据网址。大家可以看下面的案例讲解来学习! 本规则为火车采集器V9版规则,其他低版本不可使用。 本规则采集安居客小区信息,仅抓取北京地区的小区为例。另外提示大家,因安居客有防采集措施,可能会出现验证码,建议线程设置为1本规则可能不能将全部信息采集下来,本规则仅供学习参考。 本规则使用到多页功能,以及多级列表页功能,免费版用户不可使用 本规则仅供广大用户学习交流参考,不可用以违法目的或商业用途,我们不对因使用此规则造成的任何法律问题承担责任。 商业版用户有问题或付费定制规则请联系官方客服QQ:800019423 服务热线:400-8757-060 |
【案例讲解】
今天主要讲解多页功能,其他略过!
我们抓取的信息中有小区的房源数量数据,发现在网页源码中并没有此数据。通过抓包软件fiddler抓包分析可以获取到该数据的真实网址,参照下图:
通过网址可以发现一个ID参数“337684”,于是我们可在内容页源码中看能否查找到应该ID值
通过搜索我们发现源码中存在这个值,那我们就可以通过这个值 在多页功能中拼接出房源数量数据的网址,参照下图:
左侧是获取该ID值的规则,右侧是拼接出网址,起一个名称,保存多页,下一步我们就可以通过此页获取房源数量
添加标签,通过拼接的多页网址,分析获取数据规则,注意上图的数据来源,一定要选择关联多页。
这样我们就可以通过多页功能获取到隐藏的房源数量信息了,你学会了吗?
联系我们
客服QQ:800019423
客服电话:400-8757-060
软件购买:http://www.locoy.com/buy