Robots

中文称:爬虫协议。简单说,robots.txt文件用于告诉搜索引擎哪些页面不被开放、禁止抓取。大多数搜索引擎公司都会自觉遵守该协议内容,一方面可以保护用户隐私数据,另一方面也可以通过此协议控制爬虫抓取范围,从事减少网站带宽。
相关话题
用户2
话题优秀回答者
1325 问题
1438 浏览

这样设置robots 有问题吗?? Robots 404

我的robots是这样设置的,目前文章页面不抓取,不知道哪里设置有没问题,懂得人帮我看下哈 谢谢User-agent: * Disallow: /storage/ Disallow: /data/ Disallow: /so? Disall……

1425 浏览

什么是CCbot Robots 网站日志 文章

<p>如题,很多站长在分析网站日志的时候就会发现各种各样的事情,也有很多不知名的蜘蛛陆续的到来,今天就出现了一个好久都没见过的CCbot,今天来给大家分享下</p><p>CCbot,全称为Common C……

1411 浏览

请教百度收录伪静态的问题! Robots 伪静态 PHP

我的站是用php动态做的,最近改成了伪静态,请问我要怎么让百度只收录伪静态呢,我现在的robots是这样写的  大家看看这样可以吗User-agent: *Disallow:/*.php$ ……

1398 浏览

关于双端站的pc站的robots写法 Robots 根目录

大佬们,我是第一次做双端的站点关于robots有个问题啊因为m端是放在了pc端的根目录下面,就意味pc的robots不禁止m目录的话 那抓取会变成主域名 +m+内容html,这样的话岂不是和镜像一个意思,百度直接会说我是作弊啊。。。咋办啊 ……

1396 浏览

百度站长网robots错误码:500 Robots

前几天网站变慢,更新把环境和程序装了一下,之后查看百度站长网更新robots,出现,您的服务器配置有误,百度暂时无法连接您的服务器,请检查服务器的设置,确保您网站的服务器能被正常访问。错误码:500。是什么意思?……

1392 浏览

为什么我的站排名词一直在掉呢 Robots 排位 排名

<p>经过我2个月的优化,前100从30多个增加到了90多个,不过不知道为啥,最近一直在掉,索引量也在掉,一天掉了一百多。而且最近收录也不行了,之前都是小时级收录,最快18分钟收录。淦。快排没做过。我个人觉得可能的原因:<……

1386 浏览

robots文件问题咨询 Robots 文章

robots文件问题咨询robots文件既然分Allow: /和Disallow: /  我的问题是我先要被抓取的很简单只有首页、栏目页、文章页,除此以外各种图片、会员、任务、等等目录都没有收录价值而且非常杂乱,禁止起来比较麻烦。那么我只书……

1385 浏览

百度蜘蛛抓取内容页怎么处理? Robots 百度移动 站内站 移动端

搜6的几个网站,百度PC蜘蛛只抓取首页,百度移动端蜘蛛只抓取首页跟站内站,不抓取文章和产品的内容,这种情况问题出在哪里呢??  robots也没啥问题  问题出在哪呢?    该怎么解决比较合适呢?……