Robots

中文称:爬虫协议。简单说,robots.txt文件用于告诉搜索引擎哪些页面不被开放、禁止抓取。大多数搜索引擎公司都会自觉遵守该协议内容,一方面可以保护用户隐私数据,另一方面也可以通过此协议控制爬虫抓取范围,从事减少网站带宽。
相关话题
用户2
话题优秀回答者
1325 问题
838 浏览

屏蔽蜘蛛后百度站长平台仍然能正常抓取????? Robots 站长平台

前段时间进行了网站迁移,可是我忽视了一个事情我之前是有两个网站解析到一个域名上面,因为怕一些事情就吧这个网站下面的Robots给屏蔽了,这次网站迁移没有配置这个 ,我就一直好奇,为啥我的蜘蛛一直是0。也查了很多东西都不知道,然后百度站长平台……

838 浏览

请问,如何设置网站robots文件? Robots

问题如下:    例如有网站www.abc.com,有www.abc.com/news?_bd=225 和www.abc.com/news两个链接,我想让蜘蛛抓取www.abc.com/news里面的内容,而不想让蜘蛛抓取www.abc.c……

837 浏览

百度抓取失败 Robots

百度站长抓取诊断,首页和目录抓取成功,内容页抓取失败,robots.txt没问题,有知道什么原因吗?……

833 浏览

想问下取消禁止抓取需要多久生效 Robots 网站日志

<p>我之前网站没弄好的时候在robots.txt加了Disallow:/禁止搜索引擎抓取。网站做好之后就取消了。但是现在都过去一个月了为什么还没收录啊。是不是取消得过一段时间才能生效。网站都做好一个多月了。百度一次也没来抓取。……

833 浏览

robots文件正确的写法? Robots 索引

User-agent: *//禁止所有搜索引擎搜目录1、目录2、目录3Disallow: /目录名1/Disallow: /目录名2/Disallow: /目录名3/http://www.cddgg.net/……

831 浏览

抓取的时候一直提示robots封禁怎么办? Robots 百度蜘蛛

网站robots.txt文件已经删除里面所有的内容,现在是一个空文件。站长后台 robots检测更新 都是没有问题,校验网址是否被阻止 是允许。反馈中心也反馈了,也不给回复。我该怎么办?来个官方的帮忙处理一下吧。(补充一下,网站新搭建的时候……

830 浏览

网站有大量404 页面 已经提交了百度死链 看着百度反馈成功了,robots 文件是否还有屏蔽的必要 Robots 404

网站有大量404 页面 已经提交了百度死链 看着百度反馈成功了,robots 文件是否还有屏蔽的必要,现在看蜘蛛每天还在爬 404 页面,到底要不要做robots 屏蔽呢,屏蔽的话 对蜘蛛有没有影响。如果屏蔽的话,几千的404 也会导致ro……

827 浏览

百度一直抓取已经删除的链接,如何减少抓取这样的链接? Robots 网站内链 404 索引

百度一直抓取已经删除的链接,抓取404链接的占比已经是200链接的好几倍了,如何减少抓取这样的链接?在网站内链和网站地图已经剔除了这些链接,只有百度在疯狂的抓取,其它搜索引擎都不会大量抓取已经删除的链接。由于url规则因素无法通过robot……

827 浏览

robots禁止抓取来路统计域名怎么写? Robots 索引

由于在别的地方留了外链,以https://tubaniu.com/?seowhy这样的方式留的,主要是方便统计来路,/?xxxx 这样的外链统计url有不少,请问怎么屏蔽搜索引擎抓取收录呢? 在robots文件中如何写?感谢各位大佬指教!……

824 浏览

robots.txt中可以屏蔽中文url吗? 中文URL Robots

请问下各位,robots.txt,中如何屏蔽中文url,一个目录下,有英文url和中文url,xxx.com/xxx/吃饭/xxx.com/xxx/手机/xxx.com/xxx/abc/如何把其中的中文url在robots.txt中屏蔽呢?……

815 浏览

自学用模板做的网站十二天了还没被收录,是什么原因? Robots 代码

几个月以前在网上下了一套免费的模板,然后自己用dreamweaver对每个页面进行了修改,也修改了内容,该删的都删了,做好了之后就到搜索引擎提交了链接,可是几个月一直都没有被收录,蜘蛛来都没来,现在我又用另外一套源码重新做了一个网站,主要是……

815 浏览

关于robots的骚操作带来一个血的教训! Robots

前几日发现很多国外的垃圾蜘蛛,还有bing msn等等这些蜘蛛来我网站特别的多,所以就想着把垃圾蜘蛛给屏蔽掉,User-agent:AhrefsbotDisallow: /但他娘的一时不慎,把这行复制在了robots文件的最后面,放上去后忘……

814 浏览

关于采集内容,这样的处理方式。大家觉得是否可行呢? Robots 搜索结果 文章

所有采集页不传递权重,robots屏蔽,采集大概几十万篇文章后像制作专题一样的 生成搜索结果的html页面?这样的话内容相当于是很多段描述拼凑在一起的 内容应该非常原创了吧。。。实验过一次,不这样的话采集页面对于垃圾站也来不了什么流量吧。。……