Robots

Robots

中文称:爬虫协议。简单说,robots.txt文件用于告诉搜索引擎哪些页面不被开放、禁止抓取。大多数搜索引擎公司都会自觉遵守该协议内容,一方面可以保护用户隐私数据,另一方面也可以通过此协议控制爬虫抓取范围,从事减少网站带宽。
相关话题
夫唯
话题优秀回答者
1314 问题
1117 浏览

百度的robots到底怎么了,一直说我是robots限制? Robots 搜狗 吐槽

我从来没限制过robots文件。从4月27号开始,百度搜索结果莫名其妙就变为robots限制。 我进百度站长平台,检测robots,模拟抓取都是正常。然后把robots文件彻底清空,然后每天重新检测,模拟抓取,每天手动提交链接。期间还听从别……

1110 浏览

移动端网站seo优化的小技巧 Robots URL结构 PC网站 文章

 一、域名和robots设置。  1、域名尽可能简短易记,大部分手机端网站的域名是PC端网站的二级域名,当然这个也很好,与传统网站保持一致,更让重视用户信赖。但是如果是专门的手机网站,最好起一个简短而且易记的域名。比如百度推荐使用以m开头的……

1100 浏览

这样设置robots 有问题吗?? Robots 404

我的robots是这样设置的,目前文章页面不抓取,不知道哪里设置有没问题,懂得人帮我看下哈 谢谢User-agent: * Disallow: /storage/ Disallow: /data/ Disallow: /so? Disall……

1095 浏览

网站没搭建好就被收录了 有什么影响 Robots Site

我网站开始做的时候直接上了robots禁止抓取,经过了几天算是正式做好提交上线了,提交站长后顺手site查看了一下,没想到首页已经被收录了,点击快照一看,是网站刚安装好的初始界面,内容关键词都是默认的时候在我上robots之前的空档秒收录了……

1092 浏览

大家帮忙解决我站爱跨境论坛robots.txt的问题 Robots

我的网站robots.txt www.ikuajing.com/robots.txt  里面禁止了/data/但是我想让搜索引擎允许收录这个图片,又要禁止搜索引擎抓取DATA其他的文件的内容,该怎么写 我的图片地址是:www.ikuajin……

1072 浏览

新站为什么10多天还不收录?好着急!!! Robots

一个新网站,放开蜘蛛已经一个星期了,但是还是不收录。很奇怪,检查robots文档也都正常。也提交了给了搜索引擎,但是到现在首页都没有收录,大家帮我看看这个网站https://www.bazayu.com/是哪里出了问题?……

1069 浏览

网站首页被k该如何查找原因 Robots JS 404 代码

一、近期网站修改记录  SEO的每一个重要方案的上线迭代时间点,都需要进行记录,作为之后对问题的排查和线索发现的依据,同时建立方案到效果的量化关系,与K站相关的常见几种问题:  1)、导致错误链接的修改  2)、影响站内结构的调整  3)、……

1062 浏览

蜘蛛只抓取robots.txt Robots

为什么我网站的蜘蛛只抓取robots.txt和内页。。。不抓取首页.... 有大佬遇过这问题吗。。。没……

1061 浏览

百度蜘蛛抓取内容页怎么处理? Robots 百度移动 站内站 移动端

搜6的几个网站,百度PC蜘蛛只抓取首页,百度移动端蜘蛛只抓取首页跟站内站,不抓取文章和产品的内容,这种情况问题出在哪里呢??  robots也没啥问题  问题出在哪呢?    该怎么解决比较合适呢?……