搜外网>搜外问答>问答页面

robots具体应该禁止些什么文件

微信

Robots

本帖由用户发布，如有侵权联系删除 2023-04-04 发布1,115 次浏览

交换友情链接，就用搜外友链，方便！

6 人参与回答

用户189805 · 315防伪标签办理中心-全国315产品防伪查询中心

网站不参与排名的都可以屏蔽的哦

用户231805

JS，css，PHP文件！

用户157310 · 普通上班族，只想过平静的生活。

不参与排名的都可以屏蔽

用户153190 · 精益生产管理与六西格玛管理咨询，培训机构

1)、图像目录

图像是构成网站的首要组成元素。跟着现在建站越来越便利，许多CMS的呈现，真实做到了会打字就会建网站，而正是由于如此便利，网上呈现了许多的同质化模板网站，被重复运用，这样的网站查找引擎是必定不喜爱的，就算是你的网站被录入了，那你的作用也是很差的。若是你非要用这种网站的话，主张你大概在Robots.txt文件中进行屏蔽，一般的网站图像目录是：imags 或许 img;

2)、网站模板目录

如上面图像目录中所说，cms的强大和灵敏，也致使了许多同质化的网站模板的呈现和乱用，高度的重复性模板在查找引擎中形成了一种冗余，且模板文件常常与生成文件高度类似，相同易形成相同内容的呈现。对查找引擎很不友爱，严峻的直接被查找引擎打入冷宫，不得翻身，许多cms有具有独立的模板寄存目录，因而，大概进行模板目录的屏蔽。一般模板目录的文件目录是：templets

3)、css、JS目录的屏蔽

css目录文件在查找引擎的抓取中没有用途，也无法供给有价值的信息。所以强烈主张在robots.txt文件中将其进行屏蔽，以进步查找引擎的索引质量。为查找引擎供给一个简洁明了的索引环境更易晋升网站友爱性。css款式的目录一般情况下是：css 或许 style

js文件在查找引擎中无法进行辨认，这里仅仅主张，能够对其进行屏蔽，这样做也有一个优点：为查找引擎供给一个简洁明了的索引环境;

用户170831

禁止你的程序文件，JS，css，PHP文件！

用户210295

Robots.txt是一个文本文件，用于告诉搜索引擎蜘蛛哪些页面是可以被抓取，哪些页面是不允许被抓取的。Robots.txt文件中可以使用“Disallow”指令来禁止搜索引擎抓取指定的文件或目录。具体应该禁止哪些文件或目录，需要根据网站的实际情况进行考虑和设置。以下是一些常见的禁止设置：
1. 禁止搜索引擎抓取敏感信息：如用户登录信息、支付信息等，可以使用“Disallow: /admin”或“Disallow: /user”等指令来禁止搜索引擎抓取这些目录。
2. 禁止搜索引擎抓取无关信息：如网站的备份文件、测试文件等，可以使用“Disallow: /test”或“Disallow: /backup”等指令来禁止搜索引擎抓取这些文件或目录。
3. 禁止搜索引擎抓取重复内容：如网站的标签页、分类页等，可以使用“Disallow: /tag”或“Disallow: /category”等指令来禁止搜索引擎抓取这些页面。
需要注意的是，Robots.txt文件只是一个建议，而不是强制性规定。一些搜索引擎可能会忽略Robots.txt文件中的指令，或者对禁止设置进行解释和调整。因此，需要根据搜索引擎的规则和网站的实际情况进行设置和调整。

robots具体应该禁止些什么文件

提供服务

常用链接

产品实验室

robots具体应该禁止些什么文件

收录宝

蜘蛛池

提供服务

常用链接

产品实验室