搜外网>搜外问答>问答页面

请问如何用Robots文件禁止百度蜘蛛抓取特定类型的链接？悬赏3元已结束

微信

请问如何用Robots文件禁止百度蜘蛛抓取包含有“guestbook-sid-[?]

” 的网址完整网址是这样的：https://www.xxxx.com/shop/guestbook-sid-24447.html[?]

本帖由用户发布，如有侵权联系删除 2020-12-24 发布1,972 次浏览

交换友情链接，就用搜外友链，方便！

15 人参与回答

用户144761 · 擅长SEOSEM爱采购诊断、方案编写、优化运维。微信：tuituiwaseo

用户103454、用户156223 等 2 人赞同该回答

1、静态的URL只能一个一个的屏蔽掉；

2、如果这些页面要被屏蔽掉，可以去掉生成这些URL的留言版块，从根源取消这些URL；

QQ截图20201224202742

用户162315

用户103454 等 1 人赞同该回答

禁止百度蜘蛛抓取本站所有链接：

User-agent: Baizhispider

Disallow: /

User-agent: daozhuanspider

Disallow: /

单个链接shu的话可以直接写dao出。内容最好是写链接的目录形式。

用户189325

直接把连接加进去。。。

用户136246 · Shuke.→谷歌SEO服务咨询微信：15877060841

有时候百度还是照样抓取的

用户187953 · 安徽阳光心健科技发展有限公司是一家专业心理咨询室设备产品生产厂家，主要从事音乐放松椅,心理沙盘，箱庭,宣泄人,vr音

代码：

User-agent: *

Disallow: /shop/*guestbook-sid*.html

解释：

User-agent:

用于指定某个搜索引擎蜘蛛，如果使用通配符*代表所有的搜索引擎蜘蛛，如：

User-agent: Baiduspider指的是指定百度蜘蛛；

User-agent: Googlebot 指的是指定谷歌蜘蛛。

Disallow: /

代表着禁止抓取网站的某些内容，如“/”后面没有任何参数代表禁止抓取网站所有内容。

Disallow: /admin/ 禁止抓取admin目录下的所有内容；

Disallow: /cgi-bin/*.htm 禁止抓取/cgi-bin目录下的所有以.htm结尾的文件；

Disallow: /*?* 禁止抓取网站中所有包含问号 (?) 的网址；

Disallow:/ab/ 禁止抓取ab文件夹下面的文件；

用户189805 · 315防伪标签办理中心-全国315产品防伪查询中心

这个应该禁止动态把，也可以静态写进去的

用户172653

原来写了屏蔽还可以去站长工具里抓取诊断一下，之前一直没想到这个验证方法

用户122498 · 网站客服系统、在线聊天软件、智能客服系统

就按照你的想法设置下，在百度站长上检测下，看看呗！

用户135470

你禁止动态就可以了，动态不太友好

用户129887

禁止他爬存页面的文件夹

用户151205 · 期货公司排名，期货知识，免费期货开户流程

静态网站可以直接写进去不抓这个页面

用户188402 · B2B免费信息发布网》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》

就这样看看

用户170711

Disallow: /guestbook-*

匿名用户

这个禁止不了，该来抓取还是一样来的

用户33988 · 冷却塔

禁止动态就可以了

请问如何用Robots文件禁止百度蜘蛛抓取特定类型的链接？悬赏3元已结束

提供服务

常用链接

产品实验室

请问如何用Robots文件禁止百度蜘蛛抓取特定类型的链接？ 悬赏3元 已结束

收录宝

蜘蛛池

提供服务

常用链接

产品实验室

请问如何用Robots文件禁止百度蜘蛛抓取特定类型的链接？悬赏3元已结束