Robots

中文称:爬虫协议。简单说,robots.txt文件用于告诉搜索引擎哪些页面不被开放、禁止抓取。大多数搜索引擎公司都会自觉遵守该协议内容,一方面可以保护用户隐私数据,另一方面也可以通过此协议控制爬虫抓取范围,从事减少网站带宽。
相关话题
用户2
话题优秀回答者
1325 问题
1951 浏览

请问有没有大神知道如何用Robots文件禁止百度蜘蛛抓取异常链接? Robots 抓取异常 404

<p>是这样的一个情况,我每次提交404死链的时候,我都会发现有一个异常链接,而这个链接是跟在我的域名后面的,我不知道为什么递交了好几次404死链,删除了,要不了了解就又有了,我查询过那个域名是一个养鱼的网站,于是我被百度反馈,……

1928 浏览

谷歌蜘蛛一直都在,而且访问搬家前的虚拟主机路径?(网站谷歌收录被劫持了13w多的垃圾收录怎么解决?) 云主机 Robots 谷歌收录 阿里云

<p>1.我是网站搬家,以前这个网站在阿里云虚拟主机上的,现在搬到腾讯云服务器。但现在谷歌蜘蛛还在不停的抓这个链接,每秒都有,这个链接是原来阿里云主机的网站路径,已经在robots里加了Disallow: /data/  但他还……

1893 浏览

查看robots.txt Robots

User-agent: *Crawl-delay: 10 无论使用哪种用户代理, 都应该在两次下载请求之间给出10秒的抓取延User-agent: GooglebotDisallow: /loginDisallow: /logoutDisa……

1892 浏览

新站无蜘蛛抓取,未放出合理的首页 推荐热议 Robots 老域名 备案 404

新站建设周期一直是robots封闭着呢,现在打开后且长期更细内容、发布外链,但还是一个百度蜘蛛都不来,来的基本都是自己在百度站长平台检测模拟的蜘蛛,现状:新站是用了老的域名,新的服务器新站有采用https,且是顶级域名跳https://ww……

1891 浏览

Robots自动修改是怎么回事 推荐热议 Robots

通常我设置的是允许所有搜索引擎抓取,可是过半个月就会自动变成禁止所有搜索引擎抓取,已经自动修改2回了,这个网站我接手一个月就两会了,谁知道怎么回事,请教各位大佬了。……

1886 浏览

robots问题 Robots 网站日志

<p>大神们帮我看看  我这个robots文件规则写错了,怎么禁止了,网站日志显示百度蜘蛛还在抓取admintlhb这个目录??</p><p>然后这个我是不是要禁止一下skin这个目录</p>……

1873 浏览

网站 robots是禁止抓取? Robots

我以前有个站,建站期间robots禁止了所有抓取,百度还把我首页收录了。

1855 浏览

seo框架 Robots Site cookie 404

机呼科技1、SEO基础知识  本节主要是让大家知道SEO是什么意思,对SEO有一个基础性的了解,化繁从简,快速入门的SEO基础知识,它包括:  ① 搜索引擎的工作原理、网站权重、百度快照、百度指数  ② Robots.txt、sitemap……

1852 浏览

百度抓了网站根目录没有的文件? 推荐热议 Robots 根目录

<p>网站土工布tugongbu369.com,最近百度一直在抓一个叫card的文件,但是根目录并没有这个文件,然后robots.txt禁止了还是在抓,隔两天来一次,一词抓取2000次左右,然后查了路径是以card/ShareL……

1840 浏览

网站robots怎么写了 Robots

<p><br></p><p>www.3sjtw.com   www.aiidol.com    www.nanry.com  三个网站的robots.txt都是这个问题,该怎么搞啊</p……