Robots

Robots

中文称:爬虫协议。简单说,robots.txt文件用于告诉搜索引擎哪些页面不被开放、禁止抓取。大多数搜索引擎公司都会自觉遵守该协议内容,一方面可以保护用户隐私数据,另一方面也可以通过此协议控制爬虫抓取范围,从事减少网站带宽。
相关话题
夫唯
话题优秀回答者
1325 问题
775 浏览

Robots这东西站长们还有搞吗 Robots

Robots:可以告诉百度您网站的哪些页面可以被抓取,哪些页面不可以被抓取。我好想都没特意去搞过这东西。……

775 浏览

请问蜘蛛大量抓取js和css文件,用robots屏蔽会不会对网站造成影响 Robots JS

rt,最近检查蜘蛛日志,发现js和css文件的抓取词数已经是主力目录的接近五倍了,请问我这里如果屏蔽掉这些文件抓取的话,会不会影响到蜘蛛对页面样式的读取,如果不屏蔽的话,后续会不会影响收录,多谢各位大神。……

772 浏览

关于robots屏蔽问题 Robots 竞价 PV 代码

怎屏蔽蜘蛛抓取这类链接?因为做了百度竞价,添加了追踪代码。最近发现有大量这类链接的抓取记录,要不要屏蔽。http://www.xinlihua99.com/product_sjzpvc.html?source=led%E4%BA%A7%E5……

771 浏览

中英文双模板的网站如何优化处理,比较合适? Robots 二级域名

网站有中英文2个版本,应该如何处理才不会影响到中文版本的优化呢,英文是目录(www.abc.com/en)还是开个二级域名(en.abc.com)好呢?中英文两套程序是共存在一个虚机中,英文版的反正不考虑优化,是不是可以直接robots.t……

761 浏览

网站改版原来收录的URL怎么办? Robots 404 6系统 索引

网站改版有多种情况,有一种情况是:网站域名不变、网站系统要完全更换,内容继续在新系统使用。如果这个网站已存在一定时间,已有较多收录量,那么原来收录的那些URL该怎么办呢?有两个办法来解决:1、在新系统或新服务器上,增加一项功能,把老的已收录……

759 浏览

网站因为是支持后台的网站,怎么让蜘蛛不要抓取? Robots

网站www.zyxgjt。Com,是作为其他功能支撑的网站,所以不想让蜘蛛抓取,但是在服务器里写了robots,会跳到其他的内容上,和写的robots文件内容不同,返回服务器里又没有相对的文件。想问一下除了robots还有什么办法能让蜘蛛不……

753 浏览

网站改版规则 Robots 网站改版 404

网站是用wp,近期换了一个主题,现在好多404,我看了一下,之前是固定链接都是有分类的,www.xxx.com/a/1234.html,www.xxx.com/b/1234.html这种的,现在改版后没有分类,直接是www.xxx.com/……

751 浏览

robots的链接太多怎么办? Robots

robots的链接太多,不能直接限制目录,要限制链接吗?robots文件内容过多,会影响百度抓取吗?……

745 浏览

如果网站有大量的同内容不同标题的页面,应该怎么处理,网站收录了26w的内容,但是只有1万2左右的索引 网站收录 Robots 索引

如果网站有大量的同内容不同标题的页面,应该怎么处理,网站收录了26w的内容,但是只有1万2左右的索引,并且存在部分标题相同链接不同的问题。这种是删除呢?还是用robots屏蔽掉www.zyktservice.com。麻烦大神们给出出主意……