当我们在进行网站优化以及内容更新的时候会发现,大批量更新文章是需要很多关键词。而自己手动统计的关键词是远远不够使用的,因此我们会从其他同类型的网站中获取关键词,这时就要用到网页抓取工具,进行关键词的高效采集,也能大大减少时间和人力成本。
具体如何操作呢?请根据下面的步骤来学习一下。
1:得到50条百度搜索结果
如搜索“红酒”,则url为http://baidu/s?wd=红酒
而“http://baidu/s?wd=红酒&rn=50”的形式则是显示50个搜索结果。
2:填写URL
以网页抓取工具火车采集器为例,在火车采集器中填写搜索网址的真实跳转url,如需多个搜索则在txt中一行一个批量写好搜索URL,再经过参数修改或正则得到真实url即可。
因为我们需要的只是关键词,所以只采集到文章标题即可,其他内容不需要,因此内容采集规则设置见下图:
3:设置采集内容_关键词
4:采集内容选择好之后,就是发布处理的问题。发布的时候有在线发布和本地保存以及导入自定义数据库三种。一般采集关键词会选择保存在本地文件,在其他设置中我们还可以选择边采边发。
5:运行任务,采集完毕。可以看到关键词被火车采集器采集下来了,如果有需要,还可对采集到的内容进行分词设置。
网页抓取工具采集关键词比手动获取关键词要方便快捷很多,还可以从许多不同的网站获取大家所需要的关键词。