由于大量采集被百度降权,现在需要把大量的采集内容都删了吗?删了出现大量404会有问题吗?

我司网站是某个行业的领军网站,建站已经有8年之久,在百度中表现一直非常好。
正常每日IP在10万左右。
去年为了赚取更多的流量,我们在网站下建立了30个左右的目录,并采集了大约1000万个网页,这些网页和网站的核心内容并不是非常相关。
采集初期,这1000万个网页给网站每日带来50万左右的IP,这样的情况持续到了2013年12月31日。
从2014年1月1日起,网站被百度严重降权。采集的1000万网页流量从百度来的流量接近0。
网站核心内容的排名也大幅下降。但是网站首页的核心关键词排名还是不错。但是网站的所有内容都被降权,现在日IP只有5万左右。而这5万IP绝大多数都是从360、搜狗来的。百度来路只占5%。

现在我司对网站进行了全新改版,纠结的是,采集的1000万网页是否需要删除?删除了会不会因为超大量的404页面而被百度等搜索引擎继续降权。如果不删,怎么做才能恢复排名。

追加问题
    22 人参与回答
清文
清文 · S 不 EO
徐 浩卢长福梁衡 等 3 人赞同该回答

1000万收录了多少? 1000万删除?
个人觉得是 删除1000万页面,死路一条!
不删,继续优化,停止采集,猛加原创,稀释这1000万的数据。

邓立博
邓立博 · I am 门老师,欢迎关注我的微信公共账号:menlaoshi001
肖哲 等 1 人赞同该回答

删除,做404,提交百度,并屏蔽相关外链。

本来可以用二级域名做的。

常凤海
常凤海 · 细节决定用户体验!
黄镇 等 1 人赞同该回答

13年7月份,我公司网站导入10w相关采集论文,网站被降权,删除所有页面,也没有做死链接提交,直到现在网站一直半死不活的。

黎亦峰
黎亦峰 · 坚持自己,创新做事情
肖哲 等 1 人赞同该回答

分阶段的删除,这些垃圾内容存在也会影响到网站的关键词的排名
如果一次性删除完的话,产生那么多404,大量的404会导致网站排名掉得更厉害。
减少这些页面的入口,分阶段的删除,做好404,然后提交百度。
每天删除一些,再每天补回一定量的伪原创与原创。

三木
三木 · 八年网络营销经验,微信公众号:三木谈
卢长福 等 1 人赞同该回答

不删除,但可以尝试下 将你说的 那些目录 Robots禁止百度抓取。

杨超
杨超 · 河南百度营销大学讲师,最近做了一个8000+指数的词。QQ494821461
邓立博 等 1 人赞同该回答

Robots.txt分阶段的屏蔽,让这部分的内容逐步的消失,然后再删除。

直接删除对网站的影响可能是毁灭性的。

删除。必须要删除。删除之后自然会出现降权的情况,但是你的网站比较坚挺,会在一定时间后就可以得到恢复的。建议你便删除便增加原创。 如果你不想删除也可以,吧之前的页面标题和描述重新通过程序编辑成最新的。然后页面也进行穿插修改。提升这些页面的原创度之后,会有好处。

最近总是这样,真坑坑啊。啥时候能顺顺利利的!

个人建议:以用户为主,内容对用户有用的东西留着,没用就删除了吧。
需要删除的页面 提交百度404

刘清云
刘清云 · 10年SEO实战经验,与大家一起来探讨。

谢邀,同意@刘清文 所说,尽量不要删除,看看收录了多少,重复多少?内容改动别太大,如果可以尽量修改成伪原创,虽然工作量可能很大,但是,可以每天修改,日月积累便可以往好的方向转变,如果,硬要删除,建议参考楼上他们所说,做404,提交百度等工作。

这个问题可能@夫唯老师有见解个人认为影响问题主要有2个因素
第一个:是一级目录
第二个:内容与主站不相关
所以其实是可以删掉的,但考虑到数量特别巨大,所以要中和起来。

第一个建议:分批删掉,1000w篇/3个月/10w篇天,建议返回百度404代码提交死链即可
,第二个建议:用抽样法,重组聚合部分文章以上两者可以综合起来。

杨振荣
杨振荣 · 回归网站本色,细化用户体验度就是最好的优化

首先确认一下是不是因大量采集的原因造成的? 寻找一下其它的可能因素.建议不要删除.持续日常更新.一般3个月后看迹象再做处理.

宋金龙
宋金龙 · 某医疗集团旗下数家医院网络营销总监

优化站内,不断增加原创才是王道。

王博文
王博文 · 个人微信公众号:jinan_seo

既然不相关 留他何用?对用户无用的东西留着干啥?

路寻
路寻 · 创业者

楼上这么多解决方案。
无论建议删除处理,还是保留处理,目的是让网站恢复健康水平。
1000W的不相关内容的大规模采集,是引起百度采取措施的主因。
从历届的算法来看,对这类站点的惩罚,一次比一次严重。
解决策略应该有以下几种,按优先顺序排:
1,着手制定高质量内容策略,对质量非常差的采集内容进行404处理,建议比例在20%左右。同时争取在最短的时间去稀释采集内容。
2,如果只是针对某个子站点或目录下进行采集的,可做屏蔽处理。
3,采集目录全面改版,重新做内容,之前采集的内容删除
每个站点情况不同,“我司网站是某个行业的领军网站,建站已经有8年之久,在百度中表现一直非常好。”这种情况的站点,有恢复的机会。
个人的一点建议,欢迎指评。

加载更多