Robots

中文称:爬虫协议。简单说,robots.txt文件用于告诉搜索引擎哪些页面不被开放、禁止抓取。大多数搜索引擎公司都会自觉遵守该协议内容,一方面可以保护用户隐私数据,另一方面也可以通过此协议控制爬虫抓取范围,从事减少网站带宽。
相关话题
用户2
话题优秀回答者
1325 问题
877 浏览

屏蔽蜘蛛后百度站长平台仍然能正常抓取????? Robots 站长平台

前段时间进行了网站迁移,可是我忽视了一个事情我之前是有两个网站解析到一个域名上面,因为怕一些事情就吧这个网站下面的Robots给屏蔽了,这次网站迁移没有配置这个 ,我就一直好奇,为啥我的蜘蛛一直是0。也查了很多东西都不知道,然后百度站长平台……

875 浏览

网站换了新的服务器之后,过了很久还一直抓取失败,检测了robots文件没有问题 Robots 关键词排名 排名

网站换了服务器过了一周了,显示还是抓取失败,原因是robots文件封禁,但是检测robots文件没有问题了。所有的关键词排名都没有,之前的链接是死链提交了。想知道什么时候才会有抓取成功,正常收录。……

874 浏览

新站抓取频次太低 收录慢怎么破 Robots Site Sitemap 文章

<p>这个星期接手了一个上线有两个月的新站优化工作 期间不断的提交链接 抓取诊断 更新sitemap文件 发外链 更新文章(不过是每天一篇 高度原创)但是到现在才收录了一个首页 抓取频次5个以内 这样下去 要优化到啥时候啊 新站……

871 浏览

robots文件正确的写法? Robots 索引

User-agent: *//禁止所有搜索引擎搜目录1、目录2、目录3Disallow: /目录名1/Disallow: /目录名2/Disallow: /目录名3/http://www.cddgg.net/……

870 浏览

网站有大量404 页面 已经提交了百度死链 看着百度反馈成功了,robots 文件是否还有屏蔽的必要 Robots 404

网站有大量404 页面 已经提交了百度死链 看着百度反馈成功了,robots 文件是否还有屏蔽的必要,现在看蜘蛛每天还在爬 404 页面,到底要不要做robots 屏蔽呢,屏蔽的话 对蜘蛛有没有影响。如果屏蔽的话,几千的404 也会导致ro……

870 浏览

抓取的时候一直提示robots封禁怎么办? Robots 百度蜘蛛

网站robots.txt文件已经删除里面所有的内容,现在是一个空文件。站长后台 robots检测更新 都是没有问题,校验网址是否被阻止 是允许。反馈中心也反馈了,也不给回复。我该怎么办?来个官方的帮忙处理一下吧。(补充一下,网站新搭建的时候……

868 浏览

请问,如何设置网站robots文件? Robots

问题如下:    例如有网站www.abc.com,有www.abc.com/news?_bd=225 和www.abc.com/news两个链接,我想让蜘蛛抓取www.abc.com/news里面的内容,而不想让蜘蛛抓取www.abc.c……

867 浏览

百度一直抓取已经删除的链接,如何减少抓取这样的链接? Robots 网站内链 404 索引

百度一直抓取已经删除的链接,抓取404链接的占比已经是200链接的好几倍了,如何减少抓取这样的链接?在网站内链和网站地图已经剔除了这些链接,只有百度在疯狂的抓取,其它搜索引擎都不会大量抓取已经删除的链接。由于url规则因素无法通过robot……

867 浏览

robots禁止抓取来路统计域名怎么写? Robots 索引

由于在别的地方留了外链,以https://tubaniu.com/?seowhy这样的方式留的,主要是方便统计来路,/?xxxx 这样的外链统计url有不少,请问怎么屏蔽搜索引擎抓取收录呢? 在robots文件中如何写?感谢各位大佬指教!……

862 浏览

百度抓取失败 Robots

百度站长抓取诊断,首页和目录抓取成功,内容页抓取失败,robots.txt没问题,有知道什么原因吗?……

853 浏览

新站删除robots文件一直不更新 Robots

www.qhtycs.com 这个新站加了robots然后两个月前删除这个文件,至今一直未更新,一直是禁止状态。要不要加一个允许的robots呢……

852 浏览

关于robots的骚操作带来一个血的教训! Robots

前几日发现很多国外的垃圾蜘蛛,还有bing msn等等这些蜘蛛来我网站特别的多,所以就想着把垃圾蜘蛛给屏蔽掉,User-agent:AhrefsbotDisallow: /但他娘的一时不慎,把这行复制在了robots文件的最后面,放上去后忘……

851 浏览

咨询一下,robots这么写?有没有问题 Robots PHP JS

咨询一下路过的大神们,robots这么写?有没有问题? 如果有,第几个需要修改?1,User-agent: *,2,Disallow: /*.css$,3,Disallow: /*.js$,4,Disallow: /*.php$,5,Dis……