Robots

Robots

中文称:爬虫协议。简单说,robots.txt文件用于告诉搜索引擎哪些页面不被开放、禁止抓取。大多数搜索引擎公司都会自觉遵守该协议内容,一方面可以保护用户隐私数据,另一方面也可以通过此协议控制爬虫抓取范围,从事减少网站带宽。
相关话题
夫唯
话题优秀回答者
1325 问题
448 浏览

网站地图需不需要在首页给个入口? Robots 索引

<p>我记得之前看到过 说搜索引擎蜘蛛来访网站,首先是爬robots.txt文件,如果我在robots.txt文件中放了网站地图的入口,是不是就不用在首页给网站地图的链接呀?如果给了链接,算不算作弊呢?</p><……

442 浏览

关于nofollow问题 Robots Nofollow 索引

部分网页已经添加了nofollow,而且robots协议里面也禁了,但是搜索引擎还是不停的抓取,有的甚至还收录了,应当如何处理?……

438 浏览

网站换了新的服务器之后,过了很久还一直抓取失败,检测了robots文件没有问题 Robots 关键词排名 排名

网站换了服务器过了一周了,显示还是抓取失败,原因是robots文件封禁,但是检测robots文件没有问题了。所有的关键词排名都没有,之前的链接是死链提交了。想知道什么时候才会有抓取成功,正常收录。……

421 浏览

网站后台文件需要限制蜘蛛抓取吗 Robots

每天查看日志发现抓取了很多后台文件,有的文件还是死链  需要限制吗?有的文件也添加到robots文件里的,但还是能抓取是什么缘故呢?……