搜外网>搜外问答>问答页面

蜘蛛频繁抓取.ppt后缀文件,这是什么文件?求高手解答 悬赏8元 已结束

<p>希望能有个正确答复,Www.22ayr.com</p><p>问题说明: </p><p>    买的域名,买的时候看了 没任何记录,以前有英文建站历史,但是也属于正常网站,最近蜘蛛天天抓取.ppt后缀,本人从事互联网10年左右,从未遇到过网页文件有.ppt的。希望有遇到过的解答一下。<br></p><p></p>

追加问题
    23 人参与回答
最佳回答
推推蛙
推推蛙 · 擅长SEOSEM爱采购诊断、方案编写、优化运维。微信:tuituiwaseo
mrs QSunShine 等 2 人赞同该回答

1、你的这种并非真实的蜘蛛抓取爬行,检测网站是否存在这种PPT文件;

2、蜘蛛只抓取爬行网站里面有的内容,不会无缘无故去抓取到本不存在的东西,模拟虚假蜘蛛可能会这么抓取;

3、返回码是404,百度站长里面抓取无异常,这种情况可以直接忽略掉不影响网站SEO优化

4、蜘蛛分真假,虚假模拟蜘蛛可直接忽略;

5、如果是购买的老域名,可能是蜘蛛抓取爬行以前内容,但是这块是猜想,不管模拟的虚假蜘蛛还是抓以前的,这块不会影响站点,站点只要抓取无异常就好。

seoer
seoer · seo站群
mrs Qseo为我而存在 等 2 人赞同该回答

如果是没有多大意义的页面,可以给那个连接加Nofollow,或者直接Robots下禁止抓取,便可以了,一个站的抓取量是有限的

1、不是真实的蜘蛛抓取;

2、蜘蛛仅仅抓取爬行网站内容,不会取到本不存在的东西,模拟虚假蜘蛛可能会;

3、返回码404抓取无异常,不影响网站SEO优化

4、虚假模拟蜘蛛可直接忽略;

是不是自动生成了这些后缀文件

看网站是不是被注入脚本了

楼上的大佬已经示范过了,在Robots.txt中写入禁止抓取规则就可以了

seo为我而存在
seo为我 · 五年专业seo顶级专业优化师,懂的都懂!

这种的直接Robots中写死就可以了

xiaosage
xiaos · 正图网-专注精品设计素材下载网站,覆盖平面设计、ppt模板、word文档、文化墙、视频、样机等。

PPT是幻灯片文件,如果不想被抓取,就在网站根目录添加一个Robots.txt文件,然后在里面添加Disallow: /*.PPT,这个就是高速蜘蛛,不允许抓取所有是.ppt后缀的文件,然后再到索引引擎提交更新Robots文件

首先你需要弄明白这个文件是什么文件,才好做下一步操作

首先你需要弄明白这个文件是什么文件,才好做下一步操作

这个也许是程序自动的,不用管

小小爬虫
小小爬虫 · 八年SEo、SEm丨主营上海注册公司、上海代理记账,疑问找我!

这个域名之前是做模版下载的,之前的页面内容有PPT 的。

李春雷
李春雷 · 无尘|洁净车间工程 推广经理

如果担心有问题,直接在Robots文件中禁止抓取PPT文件。

---环境检测权威检测机构广东华科检测为你解答疑问!

路人
路人 · seo小学生

这种无效抓取可以忽略不做任何处理,如果真不想蜘蛛去抓的话可以在Robots里面将这个后缀给屏蔽掉就好了,不用太在意,毕竟蜘蛛也只是机器,他抓取不一定是有规律的

乐乐
乐乐 · 入行小白,求指教

你在Robots里面加个不抓取

加载更多