Robots

中文称:爬虫协议。简单说,robots.txt文件用于告诉搜索引擎哪些页面不被开放、禁止抓取。大多数搜索引擎公司都会自觉遵守该协议内容,一方面可以保护用户隐私数据,另一方面也可以通过此协议控制爬虫抓取范围,从事减少网站带宽。
相关话题
用户2
话题优秀回答者
1325 问题
1040 浏览

robots的写法问题 Robots

我网站的导航分类结构是:www.xxx.com/abc  这样的,那么我robots应该写作:Disallow: /abc 还是 Disallow: /abc/  ?……

1293 浏览

z-blog主题robots问题 推荐热议 Robots Site Sitemap

<p>为什么z-blog很多模板商、或者seo插件商都推荐下面这种robots写法??  除了安装文件就这两个文件为什么要全禁止了?</p><p>奇怪的是全部禁止后通过尖叫青蛙检测居然是正常的,原理是什么……

1221 浏览

哪些页面需要加robots呢? Robots Nofollow

最近一段时间学习NOFOLLOW的添加方法,感谢大神们的一路知道。最近网站一直比较积极。今天想学习一下一般来讲,哪些页面需要加Robots协议呢?……

1928 浏览

谷歌蜘蛛一直都在,而且访问搬家前的虚拟主机路径?(网站谷歌收录被劫持了13w多的垃圾收录怎么解决?) 云主机 Robots 谷歌收录 阿里云

<p>1.我是网站搬家,以前这个网站在阿里云虚拟主机上的,现在搬到腾讯云服务器。但现在谷歌蜘蛛还在不停的抓这个链接,每秒都有,这个链接是原来阿里云主机的网站路径,已经在robots里加了Disallow: /data/  但他还……

2133 浏览

网站安装好简单测试了一下没啥问题才上的ROBOTS,就在这个把小时空挡收录了咋办 推荐热议 Robots 文章

彻底服了,半个月不收录也没像这样难受过..网站安装好简单测试了一下没啥问题才上的ROBOTS,就在这个把小时空挡收录了咋办随便起了个标题上传了篇文章,感觉没啥问题就上了禁止抓取,开始做网站,做了几天发现早就收录了,就在刚安装好测试那个把小时……