Robots

Robots

中文称:爬虫协议。简单说,robots.txt文件用于告诉搜索引擎哪些页面不被开放、禁止抓取。大多数搜索引擎公司都会自觉遵守该协议内容,一方面可以保护用户隐私数据,另一方面也可以通过此协议控制爬虫抓取范围,从事减少网站带宽。
相关话题
夫唯
话题优秀回答者
1314 问题
1059 浏览

请教百度收录伪静态的问题! Robots 伪静态 PHP

我的站是用php动态做的,最近改成了伪静态,请问我要怎么让百度只收录伪静态呢,我现在的robots是这样写的  大家看看这样可以吗User-agent: *Disallow:/*.php$ ……

1057 浏览

我的robots写的有点多,这样会不会不利于爬取? Robots 站长工具 百度站长工具

<p>如下图,因为网站有很多页面的内容是完全一样的,只不过url不一样,为了避免搜索引擎重复收录内容,我写了这个robots,写的条目有点多,不知道这样会不会给搜索引擎打来判断上的工作量?不知道像这样条目太多会不会影响搜索引擎对……

1057 浏览

最新网站降权,robots.txt也抓取不了 Robots h2 阿里云

最新网站降权,robots.txt也抓取不了,用百度云的服务器就是抓取不了,但是用阿里云的却可以,我线上给百度站长提供了解决需求也不解决。下面是我的反馈案例:你好,我的robots 线上可以正常访问的,地址:http://www.1stdy……

1054 浏览

什么是CCbot Robots 网站日志 文章

<p>如题,很多站长在分析网站日志的时候就会发现各种各样的事情,也有很多不知名的蜘蛛陆续的到来,今天就出现了一个好久都没见过的CCbot,今天来给大家分享下</p><p>CCbot,全称为Common C……

1053 浏览

robots协议通配符问题 Robots 百度百科

<p>关于robots协议到底能不能用通配符呢?百度百科说不能。到底能不能呢???</p><p><br></p><p><br></p><p……

1048 浏览

百度站长抓取诊断问题! Robots

<p><br>提示其他错误,然后报错了IP喝更新IP和robots   过几分钟,再次诊断,又正常了,不是一个链接这样,基本都这样!</p>……

1036 浏览

谁会做robots? Robots

http://www.ayztsj.com

1027 浏览

你们的Robots更新得了吗? Robots

在百度资源后台,你们可以更新网站Robots?,好像一直更新不了,不知道大家是否一样

1022 浏览

想屏蔽抓取问号后面的网址,robots要这么写呢? Robots

最近收录了很多 http://www.xxx.com/?mType=Group 这样的网址,问号后面的字符是随机的,如果想屏蔽要这么写呢?谢谢大佬Disallow: /?* 这样写对吗还是要 Disallow: /?*=*……

1019 浏览

网站登录页面链接用不用做robots? Robots 网站日志 排名

<p>今天看了下网站的流量,发现大部分的流量都是用户登录所致,那么请问这种不做排名的登录页面用不用做robots?我看了网站日志没有发现爬虫抓取这个登录页面的记录,但是用百度抓取诊断这个链接也能抓通。</p><……

1019 浏览

网站首页被K,百度降权了,大家帮我看看可能是什么原因? 网站被k Robots 首页被K 文章

网址:www.chinazz.org.cn说明:12.19日开始掉词,发现robots被修改为屏蔽所有抓取,赶快改回来了,之后就一直掉;在排查原因,可能性:1、近期采集政府公告文章;2、标签添加大量关键词,过度友好;3、以前添加的有些外链网……

1015 浏览

网站不收录一般都是哪些点没做好? Robots 老域名 JS 排名

一:域名垃圾很多seo小白搭建网站,前期对于seo知识相对匮乏,胡乱的使用模板搭建好了一个站点,后期苦等着一个星期、两个星期、一个月都不见网站内容收录。其中网站、内容都是用心做的,便百思不得其解。后经过圈子内部的人查了一下网站历史,才发现域……