Robots

中文称:爬虫协议。简单说,robots.txt文件用于告诉搜索引擎哪些页面不被开放、禁止抓取。大多数搜索引擎公司都会自觉遵守该协议内容,一方面可以保护用户隐私数据,另一方面也可以通过此协议控制爬虫抓取范围,从事减少网站带宽。
相关话题
用户2
话题优秀回答者
1325 问题
664 浏览

求助!!!问题描述如下 Robots

现有网站www.abc.com,登陆页为account.abc.com/login?_ag=1234,登陆页为动态,如何书写www.abc.com的robots文件呢?……

647 浏览

百度蜘蛛无法对网站正常索引爬行? Robots 百度蜘蛛 索引

百度蜘蛛无法对网站正常索引爬行,抓取诊断显示“未解析到IP或有Robots封禁 ”我的网站屏蔽蜘蛛三天之后又重新开启了,但是百度蜘蛛都不来网站爬行,后台使用抓取诊断显示“未解析到IP或有Robots封禁 ”,robots文件检测也没有问题,……

646 浏览

robots文件怎么弄? Robots 404

服务器里没有robots文件,但蜘蛛经常抓取,导致显示404。没有robots文件可不可以,如果不可以的话,应该怎么设置。……

645 浏览

请教一个社交站点SEO优化及url设置问题 Robots 同IP SEO优化 索引

主站商城A,在做个网站B,B仅做目录页面,将目录页中的产品链接到相应A中的产品页面。社交网站中一个账号只能一个域名,现在注册10个不同的域名,分别做301,这样社交中的链接点击后先到B,客户再点击产品后导到主站A。如果A和B放在同一服务器下……

641 浏览

正常网站用百度资源Robots监测提示404怎么办? Robots 404

<p>网站访问没问题,而且用百度资源“抓取诊断”也正常。</p><p>但是,百度资源“Robots”监测提示:您的服务器配置有误,百度暂时无法连接您的服务器,请检查服务器的设置,确保您网站的服务器能被正常……

639 浏览

到底哪些是不想被抓取的页面,都有哪些呢? Robots 索引

robots屏蔽问题我一直不解,可能是因为我不会设置robots.txt文件的原因。其他人都说可以用robots去屏蔽不想被搜索引擎抓取的页面,但我很迷糊,到底哪些是不想被抓取的页面,都有哪些呢?求告知,我也希望自己能够提升这块的操作能力。……

633 浏览

网站参数空白页面总是被蜘蛛抓取怎么办 Robots PHP

<p>网站参数空白页面总是被蜘蛛抓取,也写了robots了,但还是有蜘蛛挺多抓取这些空白参数页面(返回码200)好像当成了首页(也可能是假蜘蛛),怎么解决?</p><p>/index.php?m=Home……

630 浏览

关于nofollow问题 Robots Nofollow 索引

部分网页已经添加了nofollow,而且robots协议里面也禁了,但是搜索引擎还是不停的抓取,有的甚至还收录了,应当如何处理?……