Robots

Robots

中文称:爬虫协议。简单说,robots.txt文件用于告诉搜索引擎哪些页面不被开放、禁止抓取。大多数搜索引擎公司都会自觉遵守该协议内容,一方面可以保护用户隐私数据,另一方面也可以通过此协议控制爬虫抓取范围,从事减少网站带宽。
相关话题
夫唯
话题优秀回答者
1325 问题
740 浏览

中英文双模板的网站如何优化处理,比较合适? Robots 二级域名

网站有中英文2个版本,应该如何处理才不会影响到中文版本的优化呢,英文是目录(www.abc.com/en)还是开个二级域名(en.abc.com)好呢?中英文两套程序是共存在一个虚机中,英文版的反正不考虑优化,是不是可以直接robots.t……

687 浏览

屏蔽蜘蛛后百度站长平台仍然能正常抓取????? Robots 站长平台

前段时间进行了网站迁移,可是我忽视了一个事情我之前是有两个网站解析到一个域名上面,因为怕一些事情就吧这个网站下面的Robots给屏蔽了,这次网站迁移没有配置这个 ,我就一直好奇,为啥我的蜘蛛一直是0。也查了很多东西都不知道,然后百度站长平台……

806 浏览

关于网站日志分析_百度蜘蛛只抓取robots.txt Robots SEOer 排名

<p>作为SEOer近12年的工作人员,今天检测网站日志,发现百度蜘蛛200状态只抓取robots.txt文件,其他的文章,产品页面都不抓取;</p><p>因为着急让产品页面抓紧收录,获取产品词的排名:&……

615 浏览

麻烦大神们看下我robots这条是什么意思,可以把它删了不 Robots 404

<p>麻烦大神们看下我robots这条是什么意思,可以把它删了不,还有就是我已经禁止抓取动态页面了,为什么还是会出现抓取动态页面的情况,还有看日志出现很多不知道的404动态网址链接,这个需要处理不,请求大神回复</p>……

1615 浏览

新站提问:百度蜘蛛疯狂抓取wp-json这个目录,请问对网站有什么影响吗? Robots JS 宝塔

萌新做了个新站,在宝塔后台开通付费统计插件,发现百度蜘蛛疯狂抓取wp-json这个目录,请问这个目录文件有什么作用?百度蜘蛛抓取这个目录对网站有什么影响吗?有没有方法禁止百度蜘蛛抓取?目前我通过添加 移除头部 wp-json 代码,robo……

639 浏览

百度抓取失败 Robots

百度站长抓取诊断,首页和目录抓取成功,内容页抓取失败,robots.txt没问题,有知道什么原因吗?……

641 浏览

robots该不该屏蔽这个目录? Robots

我的站点手机版主要使用m.tfw66.com    网站目录绑定的是M/但是我的http://www.tfw66.com/m/   也是手机端。 这个目录是否需要robots  屏蔽掉蜘蛛的抓取?设置了是否冲突?应该如何处理?……

710 浏览

网站改版规则 Robots 网站改版 404

网站是用wp,近期换了一个主题,现在好多404,我看了一下,之前是固定链接都是有分类的,www.xxx.com/a/1234.html,www.xxx.com/b/1234.html这种的,现在改版后没有分类,直接是www.xxx.com/……

541 浏览

今天看了日志,有几个问题请教一下搜外大神,路过的大神指点指点迷津吧! Robots 友链

www.wsf1234.com非图片站的蜘蛛抓取图片频率过高,该不该改善这个问题?应该改善又该如何改善?需要在robots协议上做什么调整?蜘蛛抓取后真实访问率46%算什么水平,过高或过低?,除了布局更优质的外链和友链,还有什么优化手法?目……