关于网站日志问题

1.通过日志分析系统发现,被访问的最的地址是404页面,然后是网站地图,第三才是网站首页?
2. 分析结果为啥停留时间是空?

追加问题
    3 人参与回答
李 凯
李 凯 · Focus on the user experience,not seo
时吉祥伫望向东 等 2 人赞同该回答

我觉得你首先要先明确搜索引擎的索引过程和相关重要的步骤。

通过链接找到页面——访问Robots——(robots中有地图的话)xml地图——页面head头部——下载页面内容——排重算法——建立索引

通过上面的路径,就可以完全解释你的问题了
1、404页面访问多,可能的原因是网站改版导致之前的外部链接失效,但是搜索引擎还是会通过站内或站外的链接进行访问。这个问题就需要你检查下,网站内部是不是存在着大量的无效链接或者是死链接。站外的部分不过管。
2、访问时间为空,有两种可能,第一种可能,网站被降权导致页面不做下载,因此访问时间可能为空;第二种可能,页面没有做过修改,也就是头部会返回一个304,搜索引擎直接调用服务期内的缓存,因此就无需对页面进行下载,这个时间也可以为空。(通常配合etag/Last-Modified/expires)

我觉得你还是先解决下404的问题吧,用谷歌的站长工具看看,这个问题比较大条,会影响到网站整体的信任度。

江战洋
江战洋 · php程序员

看了一哈,你的网站在我这打不开,好像已经被K了。

姚晓伟
姚晓伟 · 搜外资深版主,关注搜索引擎研究

方便截个图看看吗?

你这个首页也是在爬的啊 只不过没有404页面多而已 不用担心 再看一段时间