搜外网>搜外问答>问答页面

5元悬赏:百度总数抓取这样的链接怎么处理! 推荐热议 悬赏5元 已结束

<p>环球二手回收网-二手设备机械、再生资源、废旧物资,废品,收购处理平台www.btgjj.com.cn</p><p>最近查看服务器日志,百度蜘蛛总数抓取这样的链接,如图:</p><p>请问怎么禁止她抓取这样的链接,请详细说明方法!</p><p><br></p>

追加问题
    28 人参与回答
最佳回答
用户144761 · 擅长SEOSEM爱采购诊断、方案编写、优化运维。微信:tuituiwaseo

1、这个返回码是403,不用禁止,返回码是4xx,意味着是无效页面,搜索引擎是不会收录这个页面的;

2、Robots使用错误,会导致不收录,确定站点不会有任何动态URL产生那么可以整站屏蔽动态URL;

3、403 返回码的含义是没有权限访问此站。这种类似需要注册才能查看,这种,你的站点当蜘蛛模拟人点击访问某个页面,被提示你无权访问,需要注册,否则不能访问。

PS:具体分析这个页面是哪里的,是如何生成的,蜘蛛为何会爬,返回码4xx,这种即使爬了网页也不会收录。

用户149790 · 十年seo经验,

使用 Robots.txt  禁止抓取动态页面

Disallow: /*?*
Disallow: /?*

然后通过百度站长平台 抓取测试一下 看看返回状态

用户161559 · 深圳翻译公司-SEO还在潜修

网站做伪静态设置,分析下路径

用户181296 · 睡前故事,哄女朋友睡觉小故事,儿童故事

你可以参考知乎的 里面做了不少的优化

你看不到的搜索引擎也不会看到。

用户64918 · 南京优折电子商务有限公司 总经理/CEO

返回403可以不用管的,不会收录的

用户137642 · 义和科技(752304405)为更多企业公司SEO排名优化,真正的做到见效收费!

好好检查一下蜘蛛抓取的路径,返回是什么,在去解决

可能是假蜘蛛

用户9738 · 专注于手机锁屏密码解锁,华为OPPOVIVO激活锁远程解锁业务。

从哪里可以看到搜索引擎来爬过,并抓取过

可以吧不想抓取的在rob里屏蔽 

用户168980 · seo、网站建设

你看不到的搜索引擎也不会看到。

Disallow: /*?*
Disallow: /?*
用户7639 · 专注企业SEO优化

我的好像也是这样


我的好像也是这样

不知道你有没有封禁过,如果没有的话可以试试

用户8362 · SEO爱好者,互交流,共成长!香港云服务器,友链交换联系776863202

我也遇到这样的情况,明明Robots已经封禁了某些目录,百度蜘蛛还是去抓取,要么是百度不遵守robots协议,要么就是假的百度蜘蛛,请问怎么识别真假百度蜘蛛IP?????并且通过日志分析发现,百度蜘蛛抓取JS,css,图片的数量要比内容页多的多,还有一些不存在的URL。

说好的悬赏,说话好的如下图片那

现在百度对以登录的方式限制浏览页面内容的方式深恶痛绝,具体是那个算法忘记了,影响是肯定的。

用户172866 · 做SEO优化、网站推广、网页制作

上面大神把答案都说了,我就不说了。

不会导致不收录。首先要明白伪静态,即所有对外访问地址已经显示为静态,对蜘蛛来说,他们访问到的也将会是静态地址。 不希望收录的动态链接,你在访问时候无法访问到的或者已经屏蔽的,蜘蛛也是无法访问的。

用户157263 · 环卫洒水车、垃圾车、压缩式垃圾车、扫路车、清扫车等专用车销售

说好的悬赏呢

动态的

用户133351 · 来搜外学习的一名普通用户

Disallow:,看看

可以现在Robots里找技术设置一下

用户90441 · 网站诊断、建站、快速排名

Disallow: /*?*
Disallow: /?*

吧这两个写在Robots里面就可以了

Robots里面写上 Disallow:/*?*  

禁止所有搜索引擎访问任何带参数的页面

这个很简单的