Robots

中文称:爬虫协议。简单说,robots.txt文件用于告诉搜索引擎哪些页面不被开放、禁止抓取。大多数搜索引擎公司都会自觉遵守该协议内容,一方面可以保护用户隐私数据,另一方面也可以通过此协议控制爬虫抓取范围,从事减少网站带宽。
相关话题
用户2
话题优秀回答者
1325 问题
851 浏览

robots文件正确的写法? Robots 索引

User-agent: *//禁止所有搜索引擎搜目录1、目录2、目录3Disallow: /目录名1/Disallow: /目录名2/Disallow: /目录名3/http://www.cddgg.net/……

849 浏览

屏蔽蜘蛛后百度站长平台仍然能正常抓取????? Robots 站长平台

前段时间进行了网站迁移,可是我忽视了一个事情我之前是有两个网站解析到一个域名上面,因为怕一些事情就吧这个网站下面的Robots给屏蔽了,这次网站迁移没有配置这个 ,我就一直好奇,为啥我的蜘蛛一直是0。也查了很多东西都不知道,然后百度站长平台……

843 浏览

请问,如何设置网站robots文件? Robots

问题如下:    例如有网站www.abc.com,有www.abc.com/news?_bd=225 和www.abc.com/news两个链接,我想让蜘蛛抓取www.abc.com/news里面的内容,而不想让蜘蛛抓取www.abc.c……

842 浏览

想问下取消禁止抓取需要多久生效 Robots 网站日志

<p>我之前网站没弄好的时候在robots.txt加了Disallow:/禁止搜索引擎抓取。网站做好之后就取消了。但是现在都过去一个月了为什么还没收录啊。是不是取消得过一段时间才能生效。网站都做好一个多月了。百度一次也没来抓取。……

842 浏览

网站有大量404 页面 已经提交了百度死链 看着百度反馈成功了,robots 文件是否还有屏蔽的必要 Robots 404

网站有大量404 页面 已经提交了百度死链 看着百度反馈成功了,robots 文件是否还有屏蔽的必要,现在看蜘蛛每天还在爬 404 页面,到底要不要做robots 屏蔽呢,屏蔽的话 对蜘蛛有没有影响。如果屏蔽的话,几千的404 也会导致ro……

842 浏览

百度抓取失败 Robots

百度站长抓取诊断,首页和目录抓取成功,内容页抓取失败,robots.txt没问题,有知道什么原因吗?……

838 浏览

抓取的时候一直提示robots封禁怎么办? Robots 百度蜘蛛

网站robots.txt文件已经删除里面所有的内容,现在是一个空文件。站长后台 robots检测更新 都是没有问题,校验网址是否被阻止 是允许。反馈中心也反馈了,也不给回复。我该怎么办?来个官方的帮忙处理一下吧。(补充一下,网站新搭建的时候……

836 浏览

robots禁止抓取来路统计域名怎么写? Robots 索引

由于在别的地方留了外链,以https://tubaniu.com/?seowhy这样的方式留的,主要是方便统计来路,/?xxxx 这样的外链统计url有不少,请问怎么屏蔽搜索引擎抓取收录呢? 在robots文件中如何写?感谢各位大佬指教!……

836 浏览

robots.txt中可以屏蔽中文url吗? 中文URL Robots

请问下各位,robots.txt,中如何屏蔽中文url,一个目录下,有英文url和中文url,xxx.com/xxx/吃饭/xxx.com/xxx/手机/xxx.com/xxx/abc/如何把其中的中文url在robots.txt中屏蔽呢?……

834 浏览

百度一直抓取已经删除的链接,如何减少抓取这样的链接? Robots 网站内链 404 索引

百度一直抓取已经删除的链接,抓取404链接的占比已经是200链接的好几倍了,如何减少抓取这样的链接?在网站内链和网站地图已经剔除了这些链接,只有百度在疯狂的抓取,其它搜索引擎都不会大量抓取已经删除的链接。由于url规则因素无法通过robot……

824 浏览

网站换了新的服务器之后,过了很久还一直抓取失败,检测了robots文件没有问题 Robots 关键词排名 排名

网站换了服务器过了一周了,显示还是抓取失败,原因是robots文件封禁,但是检测robots文件没有问题了。所有的关键词排名都没有,之前的链接是死链提交了。想知道什么时候才会有抓取成功,正常收录。……

823 浏览

自学用模板做的网站十二天了还没被收录,是什么原因? Robots 代码

几个月以前在网上下了一套免费的模板,然后自己用dreamweaver对每个页面进行了修改,也修改了内容,该删的都删了,做好了之后就到搜索引擎提交了链接,可是几个月一直都没有被收录,蜘蛛来都没来,现在我又用另外一套源码重新做了一个网站,主要是……

820 浏览

关于采集内容,这样的处理方式。大家觉得是否可行呢? Robots 搜索结果 文章

所有采集页不传递权重,robots屏蔽,采集大概几十万篇文章后像制作专题一样的 生成搜索结果的html页面?这样的话内容相当于是很多段描述拼凑在一起的 内容应该非常原创了吧。。。实验过一次,不这样的话采集页面对于垃圾站也来不了什么流量吧。。……