蜘蛛的分析方式有哪些?
蜘蛛总是反复抓取重复的页面,怎么分析蜘蛛比较准确?查询到底是查询问题,还是蜘蛛真的抓取页面重复的?为什么会被重复的抓取呢?这是什么原因,如何引导蜘蛛正确抓取方法?
3 人参与回答
进来学习一下经验
先来了解一下搜索引擎的常用蜘蛛,大概有以下几类:
索引蜘蛛(Indexing Spider):主要负责收集和索引网页
统计蜘蛛(Analytics Spider):主要用于网站统计和分析
视频蜘蛛(Video Spider):主要负责收集和索引视频内容
图片蜘蛛(Image Spider):主要负责收集和索引图片内容
移动蜘蛛(Mobile Spider):主要负责收集和索引移动端网页内容
蜘蛛进入网站后会安装设定好的程序,要么广度优先,要么深度优先。在抓取普通企业网站时蜘蛛会按照广度优先,爬取网站的网站结构,所以在我们设计网站层级时,如果出现一些没有链接到下一个页面的网页,会导致蜘蛛在遍历这个页面之后就退出爬取,所以想要引导蜘蛛抓取更多更优质的内容,要用合理的网站布局、内容及内链来引导蜘蛛去抓取。