Robots

中文称:爬虫协议。简单说,robots.txt文件用于告诉搜索引擎哪些页面不被开放、禁止抓取。大多数搜索引擎公司都会自觉遵守该协议内容,一方面可以保护用户隐私数据,另一方面也可以通过此协议控制爬虫抓取范围,从事减少网站带宽。
相关话题
用户2
话题优秀回答者
1325 问题
619 浏览

Robots这东西站长们还有搞吗 Robots

Robots:可以告诉百度您网站的哪些页面可以被抓取,哪些页面不可以被抓取。我好想都没特意去搞过这东西。……

617 浏览

网站Robots协议没有禁止蜘蛛抓取为什么蜘蛛不来? Robots

网站蜘蛛长时间不来了,我查看了也没有禁止蜘蛛抓取,可蜘蛛就是不来网站了,为什么就不来网站抓取内容了?网站究竟哪里问题导致蜘蛛不来了,服务器稳定我也每天提交链接百度,有哪里不对呢?……

613 浏览

robots.txt 设置有必要吗? Robots 排名 索引

有的网站没设置robote照样排名很好,玩意还有价值吗?robots是网站跟爬虫间的协议,用简单直接的txt格式文本方式告诉对应的爬虫被允许的权限,也就是说robots.txt是搜索引擎中访问网站的时候要查看的第一个文件。http://ww……

602 浏览

网站地图需不需要在首页给个入口? Robots 索引

<p>我记得之前看到过 说搜索引擎蜘蛛来访网站,首先是爬robots.txt文件,如果我在robots.txt文件中放了网站地图的入口,是不是就不用在首页给网站地图的链接呀?如果给了链接,算不算作弊呢?</p><……