请教关于网站内部内容重复度的问题 悬赏1元 已结束
我们网站类似论坛,有100多万的主题,然后有2000多万的回复内容,我们每一个回复内容都会有一个独立的展示页面,所以这样网站整体有2000多万的页面数。现在有1000多W的页面收录,但这些回复内容中相似度比较高,100多万的主题中也有不少的相似的长尾词主题,想问一下,这种情况下百度是不会对重复度过高的页面降权处理?因为我们发现有一些主题前阵子排名还不错,但最近发现前两页都没有排名了,而且其他的不少页面虽然在第一页,但很多在第一页的底部区域了,想请教大家,对于长尾词主题,如何避免内容相似的问题?因为长尾词之间本身相似度就很高。
9 人参与回答
罗凌峰 等 1 人赞同该回答
1、100万内容,2000万回复,产生2000多万页面,收录1000万的页面,这些1000万页面都是有效收录吗,如果并非如此,这样的回复一个评论就生成独立页面,这个操作并非友好,只会产生大量的重复同质页面,影响网站整体质量度;
2、100万内容里面相似主题只要内容不是一样,这种没啥大的问题,也是可行,主要是一个回复就产生独立的页面,这个操作可能影响整体质量;
3、之前有排名,后来没排名,全标题检索判断,查看是否还是有效收录,如果检索不到,说明页面属无效收录,无效收录不参与排名,无效收录产生的原因,主要跟内容质量,抓取异常有关,鉴于你的描述,多半与回复产生大量单独的页面有关。
ps:如果论坛能有2000万真实的访客回复,其实不靠搜索引擎的流量,也有忠实的用户群,如果回复是机器的,大量的回复产生大量独立页面会影响整体网站质量。
1、内容重复、标题重复,确实是个大问题。就算现在不降权,未来网站也会受影响的。
建议使用rel="canonical",同一个主题下的确定一个核心页面。
2、长尾词重复这个,最高建一个词库,对关键词进行分类管理。