可视化采集软件火车浏览器在编辑脚本的过程中需要对逻辑进行一系列设定,比如条件判断、循环、跳转、引用等,这里就对逻辑的具体操作简单讲解下,介绍自己的经验,希望帮助朋友们解决使用中遇到的问题。
条件判断有四种形式:1.条件判断:
1)当前页面源码
2)xpathhttp://bbs.locoyposter.com/post-21-1-1.html
在使用变量判断的时候,选择判断方式必须要选择相等。3)变量判断
4)使用代码片段
http://bbs.locoyposter.com/forum.php?mod=viewthread&tid=75&extra=page%3D1%26filter%3Dtypeid%26typeid%3D5判断值是否大于某个值等类似的判断。具体使用方法:
2.循环:
1)在一个网址需要无限反复的采集或者填写的时候,可以使用到无限循环循环一般是稍复杂的脚本中都会用到,其功能是非常强大的。其中具体有以下几种:
2)点击固定元素:当需要重复点击同一个元素的时候,比如点击下一页,便可以使用此功能
3)点击一组固定元素:当需要依次点击页面中的一组元素时,用此功能。
4)点击指定的元素列表:将需要点击元素的xpath 放在一个list变量中,再选用此功能,就可以依次点击list变量中的xpath。
5)遍历list变量,需要访问的元素放在list变量中,然后使用循环去一一访问它,比如采集网页是,list变来那个中存放的是网址,那么循环遍历是,级那个每次比昂里的网址存放在一个文本型变量中,图示“保存至变量”步骤,设置一个变量来临时存储要访问的网址,然后将变量填入“打开网页”步骤的访问地址栏,这样就可以循环打开list变量中的网址.
6)从数据库中查询数据:使用sql语句,调用数据库的数据。与列同名的变量可直接调用该列中的数据,所以使用下面的保存至变量。具体使用方法:
http://bbs.locoyposter.com/post-222-1-1.html
7)循环执行次数:可以直接填写固定值或者使用计数器变量的值来控制循环次数。
3.跳转:跳转到其他步骤
5.结束循环:循环步骤结束4.跳出本次循环:跳出当前循环的步骤,进行下一个循环
提示(跳出循环与结束循环的区别)
跳出循环:比如有 5个数,当前循环到3,使用跳出循环,则不再进行循环3的步骤,跳出这个循环后从循环数字4开始再循环。
结束循环:同样有 5个数,当前循环到3 使用结束循环,则循环结束,不再进行下面数字的循环。
6.暂停等待:这个步骤用到会比较多,有些网页打开加载比较慢(比如登录时,页面跳转时),就设置一个暂停等待的时间。等待的时间设置固定的时间,也可使用计数器变量或者随机时间。也可以使用网页中一个标志性的xpath,作为等待指定的元素,即网页中加载出这个元素后就进行下面的操作,比如一个网页中只需要进行写值时,就可以使用输入框xpath作为等待指定元素。