今天给大家分享优酷视频网站的电视剧信息采集,因使用到的多级、多页、循环功能在之前的案例都有介绍过,今天这里不再做案例讲解。
优酷的采集主要难点是剧集地址需要抓包,还有超过40集的如何采集,本分享规则,不能采集40集以上的,我在这里抛砖引玉,大家可以在此基础上再去研究。剧集地址的采集如图所示,我们用抓包分析好地址,选用参数正则提取就可以了。
内容网址获取是有多级列表,如图所示分别设置。
将需要采集的标签依次设置好,选取一个典型页面进行测试~
测试ok,可以运行起来了~
客服QQ:800019423
客服电话:400-8757-060
软件购买:http://www.locoy.com/buy