• 这一次的福利是火车浏览器的脚本,虽然很多人会误以为火车浏览器是一款浏览器软件,但其实它是一款能模拟人来操作浏览器的web操作工具,也就是说可以模拟人的登录、点击,翻页……因此可以用来实现网页采集,消息群发,自动打码,甚至还支持生成我们自己编写的程序。可视化的火车浏览器软件操作起来像我们使用浏览器一样,所见即所得~下面就讲解一下使用火车浏览...
  • 在上一期小采向大家介绍了花瓣网瀑布流数据采集思路详解,不知道大家回去有没有自己动手操作一遍呢?如果练习了就好好阅读今天这篇教程吧。之前曾经有人有人在qq群里提问如何采集b站的弹幕,恰逢上一周b站从美国纳斯达克交易所敲钟上市,所以我们特意缠着技术推出了一期b站特刊。b站的弹幕和鬼畜文化陪伴了国人这么多年走来,早已经成了”中二病“爱好者心中不...
  • 今天给大家分享优酷视频网站的电视剧信息采集,因使用到的多级、多页、循环功能在之前的案例都有介绍过,今天这里不再做案例讲解。优酷的采集主要难点是剧集地址需要抓包,还有超过40集的如何采集,本分享规则,不能采集40集以上的,我在这里抛砖引玉,大家可以在此基础上再去研究。剧集地址的采集如图所示,我们用抓包分析好地址,选用参数正则提取就可以了。内...
  • 今天再来分享一个58同城的一个规则,分享这个规则正好是有用户提到,里面有用到网址采集的自定义列表和数据处理中的时间自动修正功能,觉得有必要和大家说下。【案例讲解】今天的规则以采集58同城泉州租房信息为例,入口网址为:http://qz.58.com/chuzu/大家打开网站,参照上图,我们要采集上图红框中每个区域的信息,今天这里使用自定义...
  • 今天给大家分享住哪儿网(www.zhuna.cn)酒店基本信息采集规则。今天为大家讲解网址拼接,我们经常在采集的时候,发现源码中并没有完全的网址或完全的网站不好制定规则,那就可以使用网址拼接。下方案例讲解为大家详细说明。 本规则为火车采集器V9版规则,其他低版本不可使用。本规则采集住哪儿网酒店基本信息,本规则仅供学习参考,仅抓取...
  • 今天给大家分享携程网景点信息采集规则。其实我分享的规则都有代表性,里面会用一些针对性的采集器使用功能点,比如今天这个规则里面用到了多页功能,希望大家拿到规则不只是使用,更多的是希望大家通过分享的规则能够深入的学习,更多的掌握采集器的强大功能,同时也希望大家在此交流。本采集规则用到的多页采集功能,是收费版(基础版及以上)功能,所以免费版用不...
  • 又到了一年一度的表白日周末就是520了害羞的我把自己的心声藏在文章中如果恰好你也看见如果你也恰好喜欢我那么......你还是没对象不过没对象也没关系,毕竟小采是有偶像的人。520别人都在谈对象,那小采就献丑一番让小采带领大家探秘一下偶像胡歌的秘密世界(是不是转折太快了?毕竟我也是一篇教程文案啊~)首先我们一定要在脚本中添加微博的用户名密码...
  • 以前看3D片,感觉就只是画面立体了一点,分明知道这是在看电影。可是看完《头号玩家》,直到眼镜去下来的那一刻,清场的人等在座位边,我才恍然觉得回到了现实。我不是任何游戏的玩家,唯一在玩的称得上游戏的东西是王者荣耀,这电影里的游戏梗我基本都不懂,电影的重头戏又是《闪灵》,就那几个镜头,我也是指缝里看完的。可以说是十分不解风情了。但我还是被爽到...
  • 今天给大家分享知乎网站问题及第一条回答内容的采集采集,通过搜索guanjianci采集相应的内容,本案例需要用到抓包工具来获取入口网址,以及获得UA。下面的案例讲解给大家简单作讲解!本规则采集知乎网站问题信息为例,本规则以通过guanjianci搜索问题,采集相应文章及第一条回答等内容。本规则为火车采集器V9版规则,其他低版本不可使用。本...
  • 今天为大家带来豆瓣电影采集规则,同时为大家讲解如何本地发布csv文件。另外今天还给大家讲解如何通过fiddler抓包软件抓取网页真实网址。文件包中包含两个规则文件,一个发布模板文件,请按照以下说明使用。本规则为火车采集器V9版规则,其他低版本不可使用。本规则采集豆瓣电影信息,本规则仅供学习参考,仅抓取其中一个类别,另因豆瓣有IP限制,本规...