搜外网>搜外问答>问答页面

SEO实验室第九期:百度索引量是否比百度site收录量更接近真实情况? 推荐热议

SEO实验室活动,主要研究一些具有代表性、实战性的SEO难题,挖掘行业精英的力量,共同找寻解决办法。具有优质话题的童鞋,可以私信@夫唯。

本期SEO实验室话题是:百度索引量是否比百度site收录量更接近真实情况?

研究本话题的办法是,查看自己网站的site收录量和百度索引量的数量。
然后列出网站上的URL list,通过批量查询收录的工具,查看真实收录的情况。

拿搜外问答作为案例分析:
2013年10月8日,百度site收录量8,120个;百度索引量4,222个。图示:









列出搜外问答上的主要页面URL,并做一个列表,然后批量查询收录情况,发现真实收录情况,与百度索引量4,222个比较接近。

SEO十万个为什么,faq.seowhy.com 案例。
10月13日,百度site收录量33与索引量32基本一致。




查询方式如:
url list:ask.seowhy.com/sitemap.txt
批量查询工具如:chenhongran.com/tools/shoulu/

网页数量比较少的同学,也测试下你的网站的情况,并做回复记录供研究总结,感谢。

一般同学会发现百度索引量比百度site收录多。
追加问题
    51 人参与回答
杨营
杨营 · 网络营销2008年起,擅长整站优化及整合营销!
时吉祥臧马俊张志强吴益敏玥光宝盒 等 5 人赞同该回答

索引量是百度对网站内容索引的一个真实反映,所收录的内容基本上和爬取都是同时进行的。而Site的时候,有的内容可能只是缓存,有的文章可能被收录,也可能被百度屏蔽,而在真实索引的过程,或许百度并没有把这些内容放入到索引量中。
个人认为:索引量,索引的这些内容基本上这些页面,进入到了百度排名规则中了,而site:也是百度收录的内容,但或许有一部分内容,虽然被收录了,并没有参与到百度的页面排名中。比如:百度收录的css文件、关于我们、联系我们等网站基本信息时,这些信息基本上网络中的网站都有存在,而对于这些内容,百度如何让其参与排名?但是这些文章在搜索网址时,确实被收录了,在众多的关键词排名中,搜索引擎会对一部分没有实质意义的内容进行屏蔽或是不让参与排名。网站的后台程序文,当Robots.txt没有设置时,并且允许整站爬取时,百度可能会收录这些文件,但在索引量中,百度认为这些内容并没有实际太大的作用,并不给参与到排名中。

因为百度的索引只是一个数据,并查不到哪些才是真实的内容,site:不仅有数量,也有文章,我们可以更直观的看到这些内容,不仿看一看你的网站中,是不是收录了一些没有实质意义的内容,然后,把这些没有实质意义的内容去掉,看是不是和索引量接近了?

以上是经过对一些比较少页面的企业站进行的一些观察,并比对总结得出。如有不同欢迎共同探讨。

王建中
王建中 · 刻缘营销创始人
姜东栋人未余 等 2 人赞同该回答

索引量 就是忽悠SEO的

刘振基
刘振基 · 入行9年,独立行走在SEO的道路上,研究那些乱七八糟的玩意!莆系医疗!
开心胡萝卜 等 1 人赞同该回答

我拿手上一个4个月新站来数据说明下。
Site 一般是给客户看,索引量是给自己心里有数!
site 网站的数据是413
索引量 显示的是 508

但是我挨个页面查,到第36页之后,百度下面说省略一些相同数据,我点查看。
这个时候site数量变成505 之后在到最后一页是50页 不是51页,那就是还不到500个.~
site数据是不准确的!
而且同一时间查询 相同网站,你多点2下百度,数据会跳动变化。感觉这个数据跟地域性有关。

马裕刚
马裕刚 · 不懂seo的前端工程师不是好程序员
黄演和 等 1 人赞同该回答

公司网站索引量与Site差别巨大。
site:www。 收录145
site: 收录 86
索引:326
差别比较大.

还有一个地方论坛:
索引:18W
site:6000左右
之前是4-5W后来一直减少 到6000左右了。

諶啟立
諶啟立 · 我只是一个菜鸟
时吉祥 等 1 人赞同该回答

我的Site数据是8,也就是说蜘蛛爬了这8个页面放出来。
而我的索引数据只有3个,说明百度抓取并建立索引有3个。说明一下我的站属于刚过3个月,我认为还正常。
总结:1.索引数据和收录量大多时候是不会等同的,不同的行业,不同的站点索引出来的数据跟收录量不一样,eg:商城站点:索引量一定大于收录量。老站的索引量一定会比site数据要多。
2.新站时期的索引和收录可以反映你对一个站点的推广和优化是否正常。
3. 百度对一个站点建立索引的时间可以看出一个站点的健康状况,也可以看出一个站点以后的优化时间的长短。(这点反映在快照)。
4.当然还有更多的东西,一时没想起来。

李 凯
李 凯 · Focus on the user experience,not seo
郭振兴 等 1 人赞同该回答

你把每一个url进行单独查询的话,一样用的是Site的数据,本身是不是就是一个歧义比较大的。

建议看看百度统计后台中的入口页面的一个访问情况,针对site和索引量去看看,三者间有无大的偏差。这样才能大致反映出来一个索引和site的情况。

我自己以前就是这么做的,结果表明来访量里面有很多是site找不到的数据,但是却是被索引的

翁博
翁博 · SEO
时吉祥 等 1 人赞同该回答

占位!!!!!
刚看到这个问题
有个点没法破:就是url并非能够列举得那么完整。
例如本站有子论坛(二级目录) 论坛url没有做标准化,Site的数据下可能收录了那些我没有想到的url。
而例如搜外问答平台的URL设计到各个问题与各个问题下面的回答(各个回答是有给定url的)

这些如果真的出现在site里面呢?

还好我bbs的页面没有那么多。明早实验下。
-----------------9月10号更新--------------
突然发现我有个新站。现在来说下我的站点情况
索引量为4 site的数量为11
批量工具查询(为了保证数据的正确,直接有excel拉出网站可能出现的所有url)
批量工具查询数量为11.
结论:
1、从以上来看,site出来多少个页面那么查询url这些页面都会发现被收录。
疑点(索引量真的跟收录有关系么?如果说索引量是爬行页面数据总汇、site的数量是显示足够权值在serp的页面,那么索引量为何小于site的数量)
2、諶啟立 的第一点结论,个人表示完全不赞同!
本人新站就是商城站点。本人公司所运营的老站索引量小于site的数量。

还有就是~~~个人觉得索引量跟site都是在忽悠人的~~~
京坤
京坤 · SEO爱好者

报告一下我的博客数据:Site:出来的是216 百度索引数据:203 前段时间有这样一个问题,网站site的数据就是上不去,连续1个月site出来的数据没有变化,但是百度索引的数据不断在增长,然后又坚持了一个星期,site出来的数据猛增!!!!还请大神们分析一下。

今天突然发现我的Site数据和索引量相同!!!

蒋帅
蒋帅 · 学习

不锈钢橱柜设备 我这站有问题吧 快照不稳定且少

杨敖
杨敖 · 5年SEO经验,3年SEM经验

电影站  索引Site: 感觉差别不大....

原先收录10W的 最近不知道抽啥风

韩亚 · 90后理科生

我的个人博客索引量800多,而实际收录却是400多

郭小利 · 80后创业女

Site: 收录1080

site: 收录1380

索引;675

感觉很厉害的样子

加载更多
SEO培训招生中
157