如何避免蜘蛛重复抓取一个页面,页面多次被抓取了,应该怎么应对解决?就是每次访问日志有记录可以查看到,就是抓取页面重复了,如何解决这个问题,怎么避免重复率太高抓取?
引蜘蛛抓取新URL
引蜘蛛去爬新的页面
可以引蜘蛛去抓取爬行新的页面URL
应该是页面布局的问题
应该是内链的问题吧
你可以在重复抓取页面多内链一些内容比如引导抓取内页
1、如果想抓取爬行新的URL,可以引蜘蛛去抓取爬行新的页面URL; 2、网站可正常抓取爬行,无降权的情况下,蜘蛛池、收录宝、外链、提交推送有助于引蜘蛛;
让更多人参与回答