<p>百度蜘蛛模拟是这样<br></p><p><br></p><p><br></p><p><br></p><p>正常访问和谷歌蜘蛛模拟是这样</p>
用超级蜘蛛工具查了一下,应该是被人挂马了,不仅百度,还有360和神马的蜘蛛,都是返回两套代码,估计是用了判断语句,判断搜索蜘蛛与回普通访客访问,然后给出不同的代码。建议你去查看一下源程序,重点排查一些陌生的文件名。
你用自带的爬虫工具抓取试试,如果有乱码,赶紧想发解决吧,当然也不一定是被搞了,我抱有怀疑态度
<p>1、建议去使用百度站长里面的抓取诊断;</p><p>2、抓取下看看百度蜘蛛会抓取什么;</p><p>3、使用工具抓取显示的是标题被编码和黑掉了,去看看你自己绑定站点的百度站长里面抓取诊断;</p><p>4、以百度站长抓取诊断为准,既然模拟爬行会出现这种,说明站点应该是被攻击了。</p><p><br></p>
那肯定啊,浏览器不同,算法自然会不同
算法不一样,爬行蜘蛛不一样
匿名用户
现在没人关心谷歌的排名了,都被限制了
百度跟google在标题上的蜘蛛爬取是不一样的,有时候标题不是在百度里显示的标题,百度只展现一部分
本来就不一样
坐好百度就行了,都不是一个算法
不懂啊
学习中
这个相差有点大啊
太搞笑了哈哈。百度爬到的是什么啊。他肯定应该爬title标签里的啊,哈哈
百度蜘蛛模拟看到的标题真牛皮
搜索引擎不同,爬行截取不一样的。
让更多人参与回答