搜外网>搜外问答>问答页面

禁止抓取.php的写法哪个对:Disallow: /*.php$和Disallow: /.php$ 推荐热议

禁止抓取.php的写法哪个对:Disallow: /*.php$和Disallow: /.php$

我的小站:https://www.qilucms.com/ 突然多出了很多以.php和.aspx为后缀的404,所以就想屏蔽掉这俩

看了百度百科上面robots.txt的写法,Disallow: /*.php$和Disallow: /.php$ 都有说明,没法上传图片给大家看

请问大神,哪样写法是正规的呢。。。

追加问题
    24 人参与回答
最佳回答

Disallow: /*.PHP

应该是对的,按通配符的逻辑,*表示任意字符, $表示结尾,如果后面加了$; 那么 类似这样的应该是不会被阻止的;

另外要找404动态页的原因,是程序本身哪里有问题产生了这么多死链,还是假蜘蛛或是漏洞扫描工具在扫你的站?


真没必要这样

日志出现这种情况是有人用工具批量扫漏洞,不用理会,也没必要写进 Robots.txt

河北哈哈
河北哈哈 · 快手运营交流群:272176672 本群主要是交流小视频如何运营,如何宣传,如何变现等方面!

你就不要祸害山东啦,你这水平

第二个对

kitwei503463
kitwe · 学习与帮助人家

干嘛禁止抓取数据裤。

小鱼
小鱼 · 专业的ERP定制开发、小程序开发、软件外包、软件开发服务商, 定制化开发服务, 擅长小程序开发,微商城开发,PHP项

这样吧,Disallow: /*.PHP

SEO木子木
SEO木子 · 西瓜商学院官网SEO优化,擅长cms建站、网站优化、电商运营等,如果说对自己网站有什么疑问的,可以点击右侧免费咨询。

一、什么是Robots.txt?

  robots.txt 是网站和搜索引擎的协议的纯文本文件。当一个搜索引擎蜘蛛来访问站点时,它首先爬行来检查该站点根目录下是否存在robots.txt,

如果存在,根据文件内容来确定访问范围,如果没有,蜘蛛就沿着链接抓取。robots.txt 放在项目的根目录下。

二、robots.txt语法

   1、允许所有搜索引擎访问网站的所有部分

      robots.txt写法如下:

          User-agent:  *

          Disallow:

       或者

         User-agent:  *

         Allow:  /

      注意: 

1、第一个英文要大写,冒号是英文状态下,冒号后面有一个空格,这几点一定不能写错。

   2、禁止所有搜索引擎访问网站的所有部分

      robots.txt写法如下:

           User-agent:  *

            Disallow:  /

   3、只需要禁止蜘蛛访问某个目录,比如禁止admin、css、images等目录被索引

       robots.txt写法如下:

             User-agent:  *

             Disallow:  /css/

             Disallow:  /admin/

             Disallow:  /images/

         注意:路径后面有斜杠和没有斜杠的区别:比如Disallow: /images/ 有斜杠是禁止抓取images整个文件夹,Disallow: /images 没有斜杠意思是凡是路径里面有/images关键词的都会被屏蔽

        4、屏蔽一个文件夹/templets,但是又能抓取其中一个文件的写法:/templets/main

            robots.txt写法如下:

                 User-agent:   *

                 Disallow:  /templets

                 Allow:  /main

       5、 禁止访问html/目录下的所有以”.PHP”为后缀的URL(包含子目录)

              robots.txt写法如下:

                    User-agent:  *

                    Disallow: html/*.php

        6、仅允许访问某目录下某个后缀的文件,则使用“$”

             robots.txt写法如下:

                   User-agent:  *

                   Allow:  .html$

                   Disallow:  /

         7、禁止索引网站中所有的动态页面

                比如这里限制的是有“?”的域名,例如

                robots.txt写法如下:

                        User-agent:  *

                        Disallow:  /*?*

         

      8、禁止搜索引擎抓取我们网站上的所有图片(如果你的网站使用其他后缀的图片名称,在这里也可以直接添加)

          有些时候,我们为了节省服务器资源,需要禁止各类搜索引擎来索引我们网站上的图片,这里的办法除了使用“Disallow: /images/”这样的直接屏蔽文件夹的方式之外,还 可以采取直接屏蔽图片后缀名的方式。

        robots.txt写法如下:

             User-agent: *

             Disallow:  .jpg$

             Disallow:  .jpeg$

             Disallow:  .gif$

             Disallow:  .png$

             Disallow:  .bmp$

写robots.txt要注意的地方

       1. 第一个英文要大写,冒号是英文状态下,冒号后面有一个空格,这几点一定不能写错。

  2. 斜杠:/ 代表整个网站

  3.如果“/”后面多了一个空格,则屏蔽整个网站

  4.不要禁止正常的内容

  5.生效时间是几天到两个月

展云兮
展云兮 · 芸芸SEO大军中的一员,目前懂一些SEO内部优化和仿站知识,还在研究学习中!

PHP属于数据库的数据,为什么会展现这个。是不是文件配置错误,查下规则。

源源源
源源源 · SEM学徒

Disallow: /*.aspx$

Disallow:  /*.PHP$

plank
plank · 上海力东科技有限公司是一家致力于各类生化试剂、标准品、小分子抑制剂、液体试剂等相关产品的研发与销售的企业。

这个有用吗

Disallow: /*.php$

Disallow: /*..aspx

媒介星
媒介星 · 我要推广网www。yaotuiguang。com免费外链推广平台,高权重,免费审核

Disallow: /*.PHP
小写的PHP

怎么多出来的???

三九问答
三九问答 · 专业的有问必答平台

Disallow: /*.PHP  这个是对的

加载更多