Robots

Robots

中文称:爬虫协议。简单说,robots.txt文件用于告诉搜索引擎哪些页面不被开放、禁止抓取。大多数搜索引擎公司都会自觉遵守该协议内容,一方面可以保护用户隐私数据,另一方面也可以通过此协议控制爬虫抓取范围,从事减少网站带宽。
相关话题
夫唯
话题优秀回答者
1312 问题
526 浏览

新站删除robots文件一直不更新 Robots

www.qhtycs.com 这个新站加了robots然后两个月前删除这个文件,至今一直未更新,一直是禁止状态。要不要加一个允许的robots呢……

525 浏览

自学用模板做的网站十二天了还没被收录,是什么原因? Robots 代码

几个月以前在网上下了一套免费的模板,然后自己用dreamweaver对每个页面进行了修改,也修改了内容,该删的都删了,做好了之后就到搜索引擎提交了链接,可是几个月一直都没有被收录,蜘蛛来都没来,现在我又用另外一套源码重新做了一个网站,主要是……

522 浏览

网站改版原来收录的URL怎么办? Robots 404 6系统 索引

网站改版有多种情况,有一种情况是:网站域名不变、网站系统要完全更换,内容继续在新系统使用。如果这个网站已存在一定时间,已有较多收录量,那么原来收录的那些URL该怎么办呢?有两个办法来解决:1、在新系统或新服务器上,增加一项功能,把老的已收录……

519 浏览

如何让百度快速抓取内页 Robots Site Sitemap 百度蜘蛛

今天看了百度日志,百度蜘蛛有200多个抓取网站,但是主要主要抓取robots和sitemap文件,像产品内页和新闻内部都不抓取。这是怎么回事?有没有大神指点一下。www.snow-china.com……

519 浏览

sitemap.xml抓取失败,怎么解决,求帮助 Robots Site DNS

<p>其他的一切正常,robots 也没做什么限制,抓取测试pc和手机都是正常的,但是一直<span>就这个网站的sitemap.xml抓取失败,dns解析ip那里是我以前一个服务器,这个很早就没有用这ip了,这个情……

518 浏览

百度蜘蛛长时间不来网站怎么处理? Robots 引蜘蛛 百度蜘蛛

我也检查了robots.txt没有任何问题,没有屏蔽蜘蛛怎么蜘蛛完全不来网站了,长时间未来网站特别担心,是什么原因为什么蜘蛛不来访问网站,一个星期一次蜘蛛的痕迹都没有,究竟怎么回事为什么蜘蛛不来了,有什么办法可以引蜘蛛?……

517 浏览

百度robots协议检测的问题,求助一下 Robots

<p><br></p><p>百度站长后台检测显示错误,但是检测未验证站点就可以,www.fysdcm.com 日志也爬了已经禁止的目录,反馈百度也一直没说法</p><p>……

514 浏览

网站这样设置robots对吗 Robots 二级域名 CDN

<p><br>最近发现网站有一个二级域名跟www.这个二级域名内容一样,技术那边说是为了网站访问更快,然后把图片什么的都同步到cdn这个域名,这样写是不是可以禁止蜘蛛抓取cdn.这个域名。</p>……

514 浏览

麻烦大神们看下我robots这条是什么意思,可以把它删了不 Robots 404

<p>麻烦大神们看下我robots这条是什么意思,可以把它删了不,还有就是我已经禁止抓取动态页面了,为什么还是会出现抓取动态页面的情况,还有看日志出现很多不知道的404动态网址链接,这个需要处理不,请求大神回复</p>……

511 浏览

上线大半个月了,搜品牌词都搜不到 Robots

http://www.zhichaofadianji.com/,网站蜘蛛不爬,搜品牌词找不到,绑定开始有一个半月时间,一开始robots屏蔽了,后面解开的,求大佬们帮忙看下……