这一次的福利是火车浏览器的脚本,虽然很多人会误以为火车浏览器是一款浏览器软件,但其实它是一款能模拟人来操作浏览器的web操作工具,也就是说可以模拟人的登录、点击,翻页……因此可以用来实现网页采集,消息群发,自动打码,甚至还支持生成我们自己编写的程序。
可视化的火车浏览器软件操作起来像我们使用浏览器一样,所见即所得~
下面就讲解一下使用火车浏览器来采集百度地图关键词的操作吧~
1、打开百度地图,以推拿为关键词采集一个城市的所有推拿店的信息,包括名称、地址、电话、坐标。
2、进入火车浏览器的操作界面,开始脚本的编写。
3、新建百度推拿脚本并逐一添加步骤。
①首先是打开百度地图网页
网址输入:http://api.map.baidu.com/lbsapi/getpoint/index.html
②然后输入城市
(1)这里注意,复杂的提取可能会用到xpath,(对xpath感兴趣的话可以看看这个深入学习一下,http://www.w3school.com.cn/ )对于一些简单的直接用浏览器的点选按钮在页面上点击选取即可拾取对应的xpath了。
(2)另外需要注意对变量的管理。我们找到输入框,接下来就是添加变量,写入城市、关键词。
③设置变量的值——北京(可单步测试运行,测试能否输入城市名称)
④点击“百度一下”,及右键点击暂停等待——元素操作——点击
⑤同理,输入城市后,我们需要输入推拿并再次点击百度,就可以找到有关推拿的商家了。
4、上面是模拟访问,接下来是采集:把页面右方出现的信息采集下来,由于右方的信息有很多页,所以我们要进行分页采集。
⑥先来采集首页,设置一个循环并对页面进行一个条件判断,即判断有无数据:如有,则判断为真,单次取值;如判断为假,结束当前循环。
⑦这是采集其他页(分页),加了一个点击。
⑧最后一步,就是把采集的数据进行处理,如果有本地运行环境的话是可以导入数据库,没有的话,可以直接导入到本地。
完成后,可查看运行日志,检查每一步骤有没有成功。
火车浏览器的功能还是比较强大的,除了采集之外,群发、批量注册、自动打码等一系列复杂的网页操作都可以轻松实现。
火车浏览器软件介绍:http://www.locoyposter.com/locoyposter.html
联系我们
客服QQ:800019423
客服电话:400-8757-060
软件购买:http://www.locoy.com/buy