Robots

Robots

中文称:爬虫协议。简单说,robots.txt文件用于告诉搜索引擎哪些页面不被开放、禁止抓取。大多数搜索引擎公司都会自觉遵守该协议内容,一方面可以保护用户隐私数据,另一方面也可以通过此协议控制爬虫抓取范围,从事减少网站带宽。
相关话题
夫唯
话题优秀回答者
1325 问题
901 浏览

关于robots字段屏蔽写法的问题? Robots

假如我要屏蔽public后面的所有字段 requestUrl:/syzl-business-api/business/public/queryCityConfModel requestUrl:"/syzl-business-api/busi……

894 浏览

robots.txt 这样配置是不是错的 Robots

我的网站www.daimjia.cn[?]前几天添加了robots.txt文件, 因为我自己不懂写,然后在一个在线配置robots的网站生成了一个,我的目的是想把谷歌的蜘蛛禁了。。但是这几天所有的蜘蛛几乎都不来了,能帮我看下是不是这个配置的……

893 浏览

robots的写法问题 Robots

我网站的导航分类结构是:www.xxx.com/abc  这样的,那么我robots应该写作:Disallow: /abc 还是 Disallow: /abc/  ?……

882 浏览

昨天屏蔽谷歌蜘蛛后,网站打开速度快了很多! Robots PHP Discuz 网站打开速度

天下苦谷歌久已,以前网站打开速度慢!服务器负载经常被干满,检查了很多地方没有找到原因!昨天安装了个蜘蛛插件发现谷歌蜘蛛来得比较多!所以直接给屏蔽了谷歌蜘蛛,今天发现网站速度打开块很多了!服务器负载也接近空载在跑https://www.108……

882 浏览

大神帮忙看看robots写的对不对 Robots

页面url为:http://www.xinshouyou.com/attache/xiazai9652/我的robots写法为:Disallow: /*/xiazai*/但是蜘蛛依然还在爬取收录此类型的URL,有大神帮忙看看么……

881 浏览

如何去除一个网站的死链接? 跳出率 Robots 404 索引

处理死链接一般都是通过以下几个方法:一、给网站设置404页面404页面就是告诉访客,当前所浏览的页面出错或不存在了,请继续浏览网站其它内容。404页面可以设置成单独的一个页面,这个404页面处理好了,当用户遇到死链接的时候会有眼前一亮的感觉……

865 浏览

关于百度快照的问题 Robots 百度快照

<p>之前提问过这个问题,之所以在问一次,是想让老大哥们看下我这个网站是不是还有不利于百度抓取的东西,robots的限制指令已经修改了一个月了,百度反馈的回复一直是1-2周出结果,这都第二个两周了。很是捉急。</p>……

863 浏览

网站改版原来收录的URL怎么办? Robots 404 6系统 索引

网站改版有多种情况,有一种情况是:网站域名不变、网站系统要完全更换,内容继续在新系统使用。如果这个网站已存在一定时间,已有较多收录量,那么原来收录的那些URL该怎么办呢?有两个办法来解决:1、在新系统或新服务器上,增加一项功能,把老的已收录……

862 浏览

robots屏蔽问题 Robots

问下兄弟们像下面的链接 有没有比后面这个更简单点的写法  Disallow: /author-1.html xxxxx/author-1.htmlxxxxx/author-1_1.htmlxxxxx/author-1_2.htmlxxxxx……