搜外网>搜外问答>问答页面

关于网站只收录新闻栏目页问题及robots屏蔽后台问题 推荐热议 悬赏3元 已结束

最近公司网站收录遇到一些问题,就是一直重复收录新闻栏目页,问题大概了解到是蜘蛛抓取的链接是重复累加的链接

如“/news/news/show/id/480/news/show/id/509/news/show/id/565/news/show/id/UWB”。

期初以为是服务器带宽问题,后来升级了带宽其用了腾讯云的节点加速服务。可是问题还是没有解决。

目前有打算做以下几个动作,看是否值得做

1  原来新闻目录链接页不是伪静态,应该是通过调参数“https://www.nicerf。Cn/news?category_id=135”。这个有必要换成静态的吗(要花钱请人改)

2 /news/news/show/id/480/news/show/id/509/news/show/id/565/news/show/id/UWB 抓的这个链接状态码是200,应该最好是跳404是吧。(也要花钱,但个人感觉很必要)

3 在新闻列表页的模版文件下 head下加  <meta name="robots" content="noindex, follow"> (这个是查GPT给的建议,不让搜索引擎索引这个页面)

4 想通过robots屏蔽后台admin文件,这个其实和本问题可能不太相关,但我看很多网站都做了这一步。目前问题是robots文件是在跟目录文件public文件下。 而admin文件不是在public下,是在和public同层级的application下(application/admin/)。

那写成Disallow: /application/admin/   会不会让蜘蛛误以为 “application/admin”是在public文件下?这里我改如何下才能屏蔽admin文件?


就是前面3点是不是有必要做或者还有什么其它地方可做的?   第4点怎么屏蔽admin文件  这个网站问题真的是让我头疼,希望能在这里找到正确答案。

最后附一下上次那发的那链接问题的帖子https://ask.seowhy。Com/question/276315

追加问题
    7 人参与回答
艾克SEO
艾克SEO · ⚫新站快收⚫K站恢复 ⚫网站建设外贸 商城小程序 ⚫SEO优化 诊断 托管 运营 ⚫QQ/微信:97358052
网站建设 等 1 人赞同该回答

1、静态只是比动态更容易收录,不是不收录,有动态一样收录很好的站;
2、重复收录新闻栏目页,没有影响的,蜘蛛能跑下去,说明还是有页面或链接的;
3、和上面一样,重复收录不影响;
4、Robots可以屏蔽蜘蛛访问的。

河景一家 等 1 人赞同该回答

第一个看URL规划,想换伪静态可招人修改,看自己的定位
要是不存在地址,返回码404
这个不管用
你写的没啥问题,回头你可以测试下

推推蛙
推推蛙 · 擅长SEOSEM爱采购诊断、方案编写、优化运维。微信:tuituiwaseo
罗凌峰 等 1 人赞同该回答

1、蜘蛛一直抓取的URL,是否有通道,如果有通道,这就是URL规划存在问题;
2、如果这个URL,是不存在URL,那么势必是需要返回码变404,做死链接提交删除,返回码404,后期蜘蛛也不会再抓取;
3、Robots封禁,只能是用robots文件,再网页里面写的代码不管用,用robots,你封禁那个页面,写好就行,能测试是否已封禁,如果害怕误封禁某个页面,可以在站长平台robots哪里进行测试,随时可调整;
4、屏蔽admin,你写的那样可以测试下,这种无影响;
5、首先要确保前端没有给蜘蛛留不想被抓取爬行的页面URL通道,其次robots问题,你可操作后去检测下。

天行健咨询
天行健咨询 · 精益生产管理与六西格玛管理咨询,培训机构

蜘蛛一直抓取的URL,是否有通道,如果有通道,这就是URL规划存在问题

慢慢等吧 百度就是这样子

贱贱
贱贱 · 【广告外链发布】13年老域名 这里支持发布外链 不做“nofollow”屏蔽蜘蛛 不删帖论坛!点击右侧回形针 ✈✈

百度已经不认Robots