热门话题以及实时新闻的第一曝光点似乎永远出现在新浪微博——这个拥有广场效应的公知热土。对舆论感兴趣的大神当然不能错过,而且新浪微博值得挖掘的点真的非常多。
所以我们今天就来采它一采,对于新浪微博我们使出的杀手锏是火车浏览器(点蓝字了解一下),一款可视化的万能工具。且支持发布与采集同步,发布的时候仅需配置流程即可,无需安装接口文件哦~
流程化的火车浏览器是模拟我们手动操作的,因此只需要一步步把我们的操作流程写进火车浏览器的脚本编辑器就可以了,来看具体的配置过程:
★
1、打开网页
配置打开网页步骤,打开微博首页。打开网页需要时间,所以我们加一步暂停等待。等待多久呢?为了不浪费时间且确保不受网速等影响,我们只需等到登录窗口出现即可,所以我们用登录窗口是否存在来判断等待是否结束。未出现就继续等待,这是一个小循环~
2、模拟登录
等待结束后,我们需要先登录(新浪微博不登录可见内容有限),我们通过写值来模拟登录。在变量中写入登录账号和密码,变量勾选只读,再分别配置写用户名和写密码两个写值步骤调用变量即可。
随后我们配置一个点击步骤用来点击登录按钮,同样需要一个暂停等待用来让页面加载完毕。
3、输入并搜索关键词
登录后,我们需要查找关键词,因此配置点击搜索按钮,等待搜索框出现,跳转到有输入关键词的界面,然后向输入框中输入关键词(关键词保存在变量中,这样可以从外部传入关键词内容),再添加一个点击搜索。(你猜对了,这里还是需要一个页面加载的等待时间)
4、查看全部搜索结果
为提取全部内容,我们需要点击“查看全部搜索结果”按钮,进而一页一页的抓取数据。同样需要对该按钮是否存在进行判断。
5、提取列表
将每一页内容列表中我们需要的内容提取下来。
6、循环点击下一页 取值
通过循环点击下一页把每一页的列表都提取出来。
7、保存文本
将提取到的内容保存为文本,结束流程。
8、发布
如果需要发布内容,则需要增加以下步骤就可以,原理是类似的。
条件判断和暂停等待出现的频次很高,但都是为了确保操作元素已经加载完毕,给页面最合理的响应时间,避免因某一步骤影响最终结果。
除了采集,完全可视化的火车浏览器还可以帮你执行更多复杂的任务:营销群发、批量处理、自动打码、生成程序……感兴趣的亲可以咨询客服(企业QQ:800019423)或微信小采~
客服QQ:800019423
客服电话:400-8757-060
软件购买:http://www.locoy.com/buy