Robots

Robots

中文称:爬虫协议。简单说,robots.txt文件用于告诉搜索引擎哪些页面不被开放、禁止抓取。大多数搜索引擎公司都会自觉遵守该协议内容,一方面可以保护用户隐私数据,另一方面也可以通过此协议控制爬虫抓取范围,从事减少网站带宽。
相关话题
夫唯
话题优秀回答者
1325 问题
570 浏览

请问网站地图支持放到站外么 Robots 百度收录 二级域名 索引

入职一家公司不久,网站结构非常混乱,很多重复链接,他们还把重复的链接放到了网站地图里,百度收录的乱七八糟,各种链接。网站是外包给网络公司的,网络公司是个分公司,没技术处理真正的技术问题。处理个301他们都不会,还要我查了手册写好文件发给他们……

563 浏览

网站上线20多天了 抓取诊断一直失败 Robots 备案

已经排查过了没有屏蔽蜘蛛,robots也是允许抓取的,5.1号上线的抓取诊断就显示失败,点击了报错,提示几分钟就更新好,但是过了8天还是一直抓取失败,所以在平台反馈,反馈在12号回复说转相关工作人员分析处理,这又过了10天了,继续追问反馈 ……

558 浏览

百度一直抓取已经删除的链接,如何减少抓取这样的链接? Robots 网站内链 404 索引

百度一直抓取已经删除的链接,抓取404链接的占比已经是200链接的好几倍了,如何减少抓取这样的链接?在网站内链和网站地图已经剔除了这些链接,只有百度在疯狂的抓取,其它搜索引擎都不会大量抓取已经删除的链接。由于url规则因素无法通过robot……

556 浏览

新网站怎样才能快速上排名呢? Robots 排名 静态

怎么才能让新站快速有排名呢?(1)什么是新站:新站是上线时间段,没有排名或者排名比较浮动的网站。按照网站的时间来定上线1个月--6个月都是新站期,新站期是不稳定的,是百度对网站的考核期。(2)新站排名难的原因无非是以下这些点:新站内容比较少……

544 浏览

翻页的url有必要静态化吗? Robots 静态

网站很多内容,都有分页目前都是动态url,不过robots已经禁止抓取动态url,有必要静态化吗,静态化的好处是什么?不会产生很多相似页面的情况吗。……

542 浏览

网站长期无变化更新怎么办? Robots

网站最近一个月时间里,保持稳定正常更新优化,每天也有提交链接到百度,网站服务器稳定没有问题,Robots协议也没有禁止蜘蛛抓取,就是没有收录量增加?……

541 浏览

今天看了日志,有几个问题请教一下搜外大神,路过的大神指点指点迷津吧! Robots 友链

www.wsf1234.com非图片站的蜘蛛抓取图片频率过高,该不该改善这个问题?应该改善又该如何改善?需要在robots协议上做什么调整?蜘蛛抓取后真实访问率46%算什么水平,过高或过低?,除了布局更优质的外链和友链,还有什么优化手法?目……

536 浏览

到底哪些是不想被抓取的页面,都有哪些呢? Robots 索引

robots屏蔽问题我一直不解,可能是因为我不会设置robots.txt文件的原因。其他人都说可以用robots去屏蔽不想被搜索引擎抓取的页面,但我很迷糊,到底哪些是不想被抓取的页面,都有哪些呢?求告知,我也希望自己能够提升这块的操作能力。……