Robots

Robots

中文称:爬虫协议。简单说,robots.txt文件用于告诉搜索引擎哪些页面不被开放、禁止抓取。大多数搜索引擎公司都会自觉遵守该协议内容,一方面可以保护用户隐私数据,另一方面也可以通过此协议控制爬虫抓取范围,从事减少网站带宽。
相关话题
夫唯
话题优秀回答者
1325 问题
1143 浏览

robots.txt是必须要的吗? Robots 企业站

我网站也没做robots,是不是说网站不深的话,不需要网站地图吗?比如像企业站,一般URL都不会很深,我网站也没做网站地图,robots.txt是必须要的吗?……

1141 浏览

z-blog主题robots问题 推荐热议 Robots Site Sitemap

<p>为什么z-blog很多模板商、或者seo插件商都推荐下面这种robots写法??  除了安装文件就这两个文件为什么要全禁止了?</p><p>奇怪的是全部禁止后通过尖叫青蛙检测居然是正常的,原理是什么……

1141 浏览

百度站长平台robots无法检测了,你们都是这样吗 Robots 站长平台

百度站长平台robots无法检测了,之前还可以正常失败,最近总是提示:请求失败,我们已记录此问题并将尽快处理,请刷新页面或稍后再试。你们也是这种情况吗,现在我有些不想被抓取的页面也收录了……

1136 浏览

百度站长抓取诊断问题! Robots

<p><br>提示其他错误,然后报错了IP喝更新IP和robots   过几分钟,再次诊断,又正常了,不是一个链接这样,基本都这样!</p>……

1128 浏览

关于双端站的pc站的robots写法 Robots 根目录

大佬们,我是第一次做双端的站点关于robots有个问题啊因为m端是放在了pc端的根目录下面,就意味pc的robots不禁止m目录的话 那抓取会变成主域名 +m+内容html,这样的话岂不是和镜像一个意思,百度直接会说我是作弊啊。。。咋办啊 ……

1112 浏览

老站蜘蛛从来不爬去内页,求大神帮看robots是否设置有误? CMS Robots 备案

<p>易优的CMS,老域名建的站且已经一年半了,首页蜘蛛每天来很多次,百度收录了三四百条(首页及栏目页面),移动权重2,但蜘蛛日志显示百度蜘蛛从不爬取内页,首页来的多,会爬栏目页面,但内页不爬去也不收录。未备案。</p&g……

1110 浏览

网站一直被百度抓取wp-json怎么办? Robots JS WordPress

<p>WordPress刚建站一个月,百度就抓取乱七八糟的链接,后面用robots.txt禁止了,最近又开始抓取wp-json,用robots禁止几天都没用,该怎么办?需要在百度反馈下吗?帮我看看网站有违规吗?@蛙哥!</……

1103 浏览

网站业务文件没有在根目录下面是否有影响 Robots 404页面 根目录 404

首先,我不太确定是否有什么不好的影响,我和建站人员沟通后了解到根目录是在我们站点文件夹下public这个文件,public这个文件夹里面放了404页面,站点地图及robots文件。访问XXX/robots.txt也确实能访问。那就确定根目录……

1101 浏览

为啥我的小说站不收录内页呢 Robots Site 吐槽 Sitemap

新站上线半个月了,老域名。主动推送+robots推送+sitemap=就是不收内容页。是不是该再等等呢。小说站www.147t.com大神帮我看看行吗。顺便吐槽一下这个百度站长工具sitemap一直在等待中,抓取频次是上个月的,索引还没出来……

1101 浏览

SEO生成网站地图的工具有哪些? Robots

有没有功能强大点的网站地图生成工具,最好能根据robots去爬URL的那种。很多链接不想放到网站地图了。有没有好的网站工具推荐一下呢?……

1100 浏览

图片404影响网站优化吗?? Robots 日志分析 404

<p>日志分析里,不知道什么原因有好多图片没有(图片链接都是自己网站的 ),导致出现很多404,这样影响网站优化的吗??</p><p>把这些图片都找回来应该不现实,那这种问题该怎么处理的呢??</p……

1099 浏览

百度不讲武德,我该如何整站删除百度收录? Robots Site 根目录 404

公司的站点不管是pc还是wap收录都过百万,网站有很多内容已经下架但是百度还依然保留收录快照,为此有一些早已经下架陈年违规内容保留的快照被网监给找到导致公司被罚数万元,领导现在让我解决这个问题,我的做法是先:1、在网站根目录下面添加robo……

1094 浏览

移动端手机站的优化方法有哪些 Robots 浏览器 移动端 手机站

1、网站定位和页面设计2、手机网站适配声明3、网站尽可能简洁4、清晰的结构和明晰的导航5、做好浏览器兼容调试工作6、域名和robots设置7、避免使用弹窗、flash、java等行为8、页面细节优化9、url链接规范化10、高版本的手机站的……

1093 浏览

文章页面如何优化增加收录? Robots h2 排名 代码

文章页面如何优化增加收录?它是站内优化基础,保证站点活跃度,告诉搜索引擎今天又更新了新内容,需要过来抓取,保持爬虫对你网站的新鲜度。但是很多网站内容页面只做到更新,而无法被蜘蛛索引,导致网站迟迟没有排名,更别说权重和ip了。下面我来教大家如……

1093 浏览

百度站长网robots错误码:500 Robots

前几天网站变慢,更新把环境和程序装了一下,之后查看百度站长网更新robots,出现,您的服务器配置有误,百度暂时无法连接您的服务器,请检查服务器的设置,确保您网站的服务器能被正常访问。错误码:500。是什么意思?……