Robots

Robots

中文称:爬虫协议。简单说,robots.txt文件用于告诉搜索引擎哪些页面不被开放、禁止抓取。大多数搜索引擎公司都会自觉遵守该协议内容,一方面可以保护用户隐私数据,另一方面也可以通过此协议控制爬虫抓取范围,从事减少网站带宽。
相关话题
夫唯
话题优秀回答者
1325 问题
578 浏览

网站上线20多天了 抓取诊断一直失败 Robots 备案

已经排查过了没有屏蔽蜘蛛,robots也是允许抓取的,5.1号上线的抓取诊断就显示失败,点击了报错,提示几分钟就更新好,但是过了8天还是一直抓取失败,所以在平台反馈,反馈在12号回复说转相关工作人员分析处理,这又过了10天了,继续追问反馈 ……

612 浏览

关于robots的骚操作带来一个血的教训! Robots

前几日发现很多国外的垃圾蜘蛛,还有bing msn等等这些蜘蛛来我网站特别的多,所以就想着把垃圾蜘蛛给屏蔽掉,User-agent:AhrefsbotDisallow: /但他娘的一时不慎,把这行复制在了robots文件的最后面,放上去后忘……

516 浏览

抓取的时候一直提示robots封禁怎么办? Robots 百度蜘蛛

网站robots.txt文件已经删除里面所有的内容,现在是一个空文件。站长后台 robots检测更新 都是没有问题,校验网址是否被阻止 是允许。反馈中心也反馈了,也不给回复。我该怎么办?来个官方的帮忙处理一下吧。(补充一下,网站新搭建的时候……

1165 浏览

老站蜘蛛从来不爬去内页,求大神帮看robots是否设置有误? CMS Robots 备案

<p>易优的CMS,老域名建的站且已经一年半了,首页蜘蛛每天来很多次,百度收录了三四百条(首页及栏目页面),移动权重2,但蜘蛛日志显示百度蜘蛛从不爬取内页,首页来的多,会爬栏目页面,但内页不爬去也不收录。未备案。</p&g……

840 浏览

网站建二级域名与主域名指向同一个程序,主域名会被分掉权重吗 Robots 二级域名 竞价

如题,为了区分竞价来的线索和自然流量线索,我想将网站建一个二级域名,新建的二级域名与主域名都指向同一个网站,然后在robots中设置disallow禁止蜘蛛抓取这个二级域名,这个新建出来的二级域名会影响主域名的权重吗?……

495 浏览

网站参数空白页面总是被蜘蛛抓取怎么办 Robots PHP

<p>网站参数空白页面总是被蜘蛛抓取,也写了robots了,但还是有蜘蛛挺多抓取这些空白参数页面(返回码200)好像当成了首页(也可能是假蜘蛛),怎么解决?</p><p>/index.php?m=Home……

718 浏览

ROBOTS校验 Robots

ROBOTS输入网址校验结果显示“已允许”,是不是说明robots没有屏蔽成功呢?

534 浏览

请教下ROBOTS的问题 Robots

<p>刚刚更新了一下robots   加了  Disallow: /product/e23</p><p><br></p><p><br></p>&……

671 浏览

如何屏蔽已经收录的页面 Robots

想在robots里面屏蔽 plug/comment/?id=59  plug/comment/?id=80  plug/comment/?id=81  这种类似的页面怎么写规则……

829 浏览

seo百度快照 Robots 百度快照

<p>家人们我想问问为什么我这网站上线一年还没有百度快照呀?是那个robots屏蔽了爬虫抓取信息吗?是只要改成后面那个就可以了吗?www.fugaojiaju.com</p><p><b><……

436 浏览

网站后台文件需要限制蜘蛛抓取吗 Robots

每天查看日志发现抓取了很多后台文件,有的文件还是死链  需要限制吗?有的文件也添加到robots文件里的,但还是能抓取是什么缘故呢?……