网站日志需要定期分析
对于那些从事搜索引擎优化工作的人来说,他们都知道网站日志文件的分析在整个搜索引擎优化工作中非常重要。一些搜索引擎优化人员可能会说“没用”。可见技术水平参差不齐。许多优化人员充其量只是外部连锁出版商或编辑。他们远离整个SEO的帖子,甚至没有入门级,但他们认为自己属于SEO,更别说网络日志分析是SEO工作的基础,尤其是在大中型网站。阿里巴巴前搜索引擎优化主管郭平曾表示,没有博客分析工作的搜索引擎优化是“局外人”,这很讽刺,小编整理发布。
日志分析与流量软件分析的区别:
从SEO的角度来看,两者有着相同的观点:日志分析和流量软件分析可以分析各种流量、访问页面、关键字数据等
差异:
通用流量分析软件无法分析搜索引擎爬虫数据;
通用流量分析软件不分析错误链路等数据;
下面的网站日志分析能给SEO带来什么?
分析网站日志可以解决网站渠道收集不平衡的问题
在企业做SEO工作时,企业运营总监(主要负责网站SEO)会向作者咨询网站没有升级的原因,所以对网站进行初步的浏览检查。和我的同事运营总监一样,没有找到任何理由,这让我觉得他在各个方面都做得很好。我会让他发布最近几天搜索引擎抓取网页日志的记录。
通过对网站日志数据的分析,可以在几分钟内找到网站收集问题的根本原因。事实证明,百度蜘蛛每天都会将80%的抓斗分布在两个渠道下,但这两个渠道的数据非常少。与其他渠道相比,每天抓取数据量大、内容更新频繁的重要渠道不到10%,有的甚至抓取几次。经过分析,原来的百度蜘蛛在抓取过多的两个渠道中都出现了“黑洞”,也就是说,这是一个死循环,消耗了大量资源,导致网站渠道之间的网页收集不均衡,内容大的网页也很少,因为百度蜘蛛很少抓取。
无论是百度还是谷歌,他们都是通过编程技术模式下载网页,并通过多线程技术处理数亿个网页抓取问题。由于程序会有漏洞,没有完善的技术,加上网页端的HTML代码不规范,几乎没有一个网页完全符合W3C标准,另外,网页加载速度导致字节下载截断等原因,会导致搜索引擎过度重复抓取单个网页或部分特色网页,从而影响网站的整体收录。
然后,通过日志文件筛选出抓取次数过多的前几个url或某个频道的url,并通过与实际网页抓取量的比较分析问题。
当搜索引擎访问网页时,正常状态代码是200,而非200状态代码是有问题的。通过日志文件,我们可以使用网站日志分析工具(互联网上有很多相关工具)。如果有技术,我们可以使用该技术来操作日志文件,并过滤导致非200状态代码页的原因。
还有很多其他因素,比如网站是否被收录,这里就不列了。通过日志分析,比较重要的是解决网站的收录问题,尤其是占整个SEO工作80%的大中型网站。网站收集是流量提升的基础。