Robots

Robots

中文称:爬虫协议。简单说,robots.txt文件用于告诉搜索引擎哪些页面不被开放、禁止抓取。大多数搜索引擎公司都会自觉遵守该协议内容,一方面可以保护用户隐私数据,另一方面也可以通过此协议控制爬虫抓取范围,从事减少网站带宽。
相关话题
夫唯
话题优秀回答者
1325 问题
1219 浏览

网站首页被k该如何查找原因 Robots JS 404 代码

一、近期网站修改记录  SEO的每一个重要方案的上线迭代时间点,都需要进行记录,作为之后对问题的排查和线索发现的依据,同时建立方案到效果的量化关系,与K站相关的常见几种问题:  1)、导致错误链接的修改  2)、影响站内结构的调整  3)、……

1212 浏览

想屏蔽抓取问号后面的网址,robots要这么写呢? Robots

最近收录了很多 http://www.xxx.com/?mType=Group 这样的网址,问号后面的字符是随机的,如果想屏蔽要这么写呢?谢谢大佬Disallow: /?* 这样写对吗还是要 Disallow: /?*=*……

1204 浏览

百度蜘蛛抓取内容页怎么处理? Robots 百度移动 站内站 移动端

搜6的几个网站,百度PC蜘蛛只抓取首页,百度移动端蜘蛛只抓取首页跟站内站,不抓取文章和产品的内容,这种情况问题出在哪里呢??  robots也没啥问题  问题出在哪呢?    该怎么解决比较合适呢?……

1195 浏览

robots协议通配符问题 Robots 百度百科

<p>关于robots协议到底能不能用通配符呢?百度百科说不能。到底能不能呢???</p><p><br></p><p><br></p><p……

1192 浏览

蜘蛛只抓取robots.txt Robots

为什么我网站的蜘蛛只抓取robots.txt和内页。。。不抓取首页.... 有大佬遇过这问题吗。。。没……

1189 浏览

z-blog主题robots问题 推荐热议 Robots Site Sitemap

<p>为什么z-blog很多模板商、或者seo插件商都推荐下面这种robots写法??  除了安装文件就这两个文件为什么要全禁止了?</p><p>奇怪的是全部禁止后通过尖叫青蛙检测居然是正常的,原理是什么……

1188 浏览

新站为什么10多天还不收录?好着急!!! Robots

一个新网站,放开蜘蛛已经一个星期了,但是还是不收录。很奇怪,检查robots文档也都正常。也提交了给了搜索引擎,但是到现在首页都没有收录,大家帮我看看这个网站https://www.bazayu.com/是哪里出了问题?……

1182 浏览

关于双端站的pc站的robots写法 Robots 根目录

大佬们,我是第一次做双端的站点关于robots有个问题啊因为m端是放在了pc端的根目录下面,就意味pc的robots不禁止m目录的话 那抓取会变成主域名 +m+内容html,这样的话岂不是和镜像一个意思,百度直接会说我是作弊啊。。。咋办啊 ……

1181 浏览

我的robots写的有点多,这样会不会不利于爬取? Robots 站长工具 百度站长工具

<p>如下图,因为网站有很多页面的内容是完全一样的,只不过url不一样,为了避免搜索引擎重复收录内容,我写了这个robots,写的条目有点多,不知道这样会不会给搜索引擎打来判断上的工作量?不知道像这样条目太多会不会影响搜索引擎对……

1175 浏览

谁会做robots? Robots

http://www.ayztsj.com

1171 浏览

网站业务文件没有在根目录下面是否有影响 Robots 404页面 根目录 404

首先,我不太确定是否有什么不好的影响,我和建站人员沟通后了解到根目录是在我们站点文件夹下public这个文件,public这个文件夹里面放了404页面,站点地图及robots文件。访问XXX/robots.txt也确实能访问。那就确定根目录……

1170 浏览

你们的Robots更新得了吗? Robots

在百度资源后台,你们可以更新网站Robots?,好像一直更新不了,不知道大家是否一样

1170 浏览

网站首页被K,百度降权了,大家帮我看看可能是什么原因? 网站被k Robots 首页被K 文章

网址:www.chinazz.org.cn说明:12.19日开始掉词,发现robots被修改为屏蔽所有抓取,赶快改回来了,之后就一直掉;在排查原因,可能性:1、近期采集政府公告文章;2、标签添加大量关键词,过度友好;3、以前添加的有些外链网……