1 人参与回答
最佳回答
1、首页图片的抓取,一般有查看原网页的功能,主要看看首页的3:2比例的图片有没有alt属性,利于蜘蛛识别图片。
2、一般的网站头部左边都会有站点logo,对于新站想直接抓取到logo的,可以尝试站点头部左边的Logo跟头部中间的或者右边的联系方式不要弄成一整张图片,在新站建设的时候我会让程序员把左边的Logo跟中间和右边的分开(也就是并列三列布局,也有些网站左边是logo,右边是联系方式(两列布局中间为空),尺寸选择比例3:2 或者1:1,这样的话,蜘蛛进来的入口碰到的第一张图片就是站点logo,可以直接抓取到logo(蜘蛛抓取页面的顺序是从上-左-右-下循环的顺序),因为这是蜘蛛进入网站的第一个图片(亲测试验过也抓取了新站的Logo,后面过来几个月首页快照在更新n多次以后抓取了首页其他的图片了,)这样做的目的就是让新站在上线不久就可以凭借人为因素和标签属性抓取到站点logo,当然在后面的时间做好网站内容,logo权限也自然就来了。