Robots

Robots

中文称:爬虫协议。简单说,robots.txt文件用于告诉搜索引擎哪些页面不被开放、禁止抓取。大多数搜索引擎公司都会自觉遵守该协议内容,一方面可以保护用户隐私数据,另一方面也可以通过此协议控制爬虫抓取范围,从事减少网站带宽。
相关话题
夫唯
话题优秀回答者
1325 问题
1247 浏览

大家帮忙解决我站爱跨境论坛robots.txt的问题 Robots

我的网站robots.txt www.ikuajing.com/robots.txt  里面禁止了/data/但是我想让搜索引擎允许收录这个图片,又要禁止搜索引擎抓取DATA其他的文件的内容,该怎么写 我的图片地址是:www.ikuajin……

1233 浏览

请教百度收录伪静态的问题! Robots 伪静态 PHP

我的站是用php动态做的,最近改成了伪静态,请问我要怎么让百度只收录伪静态呢,我现在的robots是这样写的  大家看看这样可以吗User-agent: *Disallow:/*.php$ ……

1225 浏览

网站登录页面链接用不用做robots? Robots 网站日志 排名

<p>今天看了下网站的流量,发现大部分的流量都是用户登录所致,那么请问这种不做排名的登录页面用不用做robots?我看了网站日志没有发现爬虫抓取这个登录页面的记录,但是用百度抓取诊断这个链接也能抓通。</p><……

1206 浏览

求大神指导!!新站不收录相关问题 Robots Site 跳转 文章

<p>基本情况:公司官网改版,旧域名没用(之前也没seo优化过,只在百度收录了首页),转用了新域名,年龄3个月,基本每天更新一篇文章,但是到现在一直都没有被百度收录首页,看百度后台数据,只有链接提交有数据,抓取、索引等这些都是0……

1204 浏览

网站首页被k该如何查找原因 Robots JS 404 代码

一、近期网站修改记录  SEO的每一个重要方案的上线迭代时间点,都需要进行记录,作为之后对问题的排查和线索发现的依据,同时建立方案到效果的量化关系,与K站相关的常见几种问题:  1)、导致错误链接的修改  2)、影响站内结构的调整  3)、……

1204 浏览

最新网站降权,robots.txt也抓取不了 Robots h2 阿里云

最新网站降权,robots.txt也抓取不了,用百度云的服务器就是抓取不了,但是用阿里云的却可以,我线上给百度站长提供了解决需求也不解决。下面是我的反馈案例:你好,我的robots 线上可以正常访问的,地址:http://www.1stdy……

1202 浏览

网站没搭建好就被收录了 有什么影响 Robots Site

我网站开始做的时候直接上了robots禁止抓取,经过了几天算是正式做好提交上线了,提交站长后顺手site查看了一下,没想到首页已经被收录了,点击快照一看,是网站刚安装好的初始界面,内容关键词都是默认的时候在我上robots之前的空档秒收录了……