百度左侧搜索结果来源分类srcid - 教你精准区分百度搜索产品

吴星
吴星

发布于 2014-04-01 21:06

9264 浏览
40 评论

从前网络小白分不清楚普通结果与推广链接有什么差异。
而现在连 seo 大神都无法明确地分辨所有百度搜索产品,哪些又不是,更遑论 seo 新手及老板领导客户。
天无绝人之路,百度搜索结果页时不时冒出点不大不小的漏洞(可以在乌云网搜索百度了解详情),我在这里借助了百度 srcid 比较好地解决了这一难题。

这篇文章设定为至少需要有中学毕业及以上的英文、数学水平,和熟稔基本的搜索引擎、编程知识,
否则请返回原点。

srcid 词源

srcid 全拼是 resource_id,另外 rsv_srcid 是带 rsv 前缀的 srcid 参数,含义差不多。
或许你不了解 resource_id 是什么,但肯定知道 url 指网址。
url 全拼是 uniform resource locator,是 uri 的子集
uri 全拼是 uniform resource identifier,
去掉 uri 前面的 uniform(统一),再去掉 resource 的前缀 re(反复) 缩写为 src,最后把 identifier 改成常用的缩写形式 ID,就是 srcid

靠通过有无 F 系列和 fk,先区分出 3 类百度搜索产品。
F 系列参数是百度记录搜索结果页点击数据,但与 srcid 放在一起会出现单独研究时没有发现的新意,成为了判断第 2 类百度搜索产品的必要条件之一。
同理,fk(fetch key) 是辨别第 3 类搜索结果的必要条件之一。fk 的解释参见《百度搜索结果参数fk - 抓取键名

这里的第 1 类、第 2 类、第 3 类是以我研究这些参数的时间排序,并非优先级。

优先级

第 2 类 > 第 3 类 > 第 1 类

第 3 类 > 第 1 类
百度某三线城市服务器里的张国荣搜索结果缓存数据

默认 rn = 10 //result number(结果数量)
实际查询不会出现被第 3 类压制的第 1 类来源
但是直接访问百度 IP 会有机会看到,如上面的截图。
所以第 3 类优先级高于第 1 类
第 2 类权重高于第 3 类则留到后面再讨论

不同的境界看到的风景也不一样

使用笛卡儿坐标系是较为直观的区分百度搜索产品方式

从坐标系可以看出,seo 只能操作第 1 类搜索结果来源,其他不受 seo 直接控制。
这是由于百度并不是简单的线性增加搜索产品数量,而是二维地增加,随着 seo 不断增长,搜索产品也同比增加。

php 正则表达式

觉得用正则表达式较中文能更为简约地表达出 3 类搜索结果来源在网页源代码中的差异。

第 1 类百度搜索结果来源
(?<=id\=\")(\d{1,2})(\" srcid\=\")(\d{1,5})(?=\")


第 2 类百度搜索结果来源
(?<=srcid\=\")(\d{1,5})(\"  fk=\")(\d{0,5})(_{0,1})(.+)(\" id\=\")(\d{1,2})


第 2 类百度搜索结果来源(增补)
(?<=srcid=\")(\d{1,5})(\" fk=\"\"  id=\")(\d{1,2})


第 2 类百度左侧知心结果
(?<=srcid\=\")(\d{1,5})(\"  fk=\")(\d{0,5})(_{0,1})(\w+)(\.)(\w+)(\.)(\d{6})(\.)(\d{10})(\.)(\d{1})(\" id\=\")(zxl_)(\d{1,2})


第 3 类百度搜索结果来源
(?<=srcid\=\")(\d{1,5})(.+)(id\=\")(\d{1,2})(.+)(?=tpl)


第 3 类百度左侧知心结果
(?<=srcid\=\")(\d{1,5})(.+)(id\=\")(zxl_)(\d{1,2})(.+)(?=tpl)


当然面试 seo 的时候,hr 不会给你机会用正则表达式取代华语描述百度搜索结果,他们想要的只是汉字或 English

你能用文字解释清楚下面 5 种百度搜索结果类型的差异吗?
common result 普通结果
general result 一般结果
natural result 自然结果
normal result 正常结果
standard result 标准结果

那么,接下来还是用华文翻译正则表达式。

第 1 类 有 F 系列,无 fk

这类是传统的百度搜索结果,可以通过 seo 改变权重。

数量较多,仅列出我所知晓的一部分

srcid = 1599 普通结果(common result)
srcid = 1533 论坛帖子
srcid = 1530 百度贴吧 更多贴吧相关帖子>>
srcid = 1529 百度知道|搜搜问问
srcid = 1528 百度知道 更多知道相关问题>>
srcid = 1526 百度文库 更多文库相关文档>>
srcid = 1525 百度文库
srcid = 1524 缩略图结果,不过不是每个查询词显示缩略图
srcid = 1523 robots.txt 文件存在限制指令的结果
srcid = 1522 百度经验组图
srcid = 1517 [图文],不过不是每个查询词都显示 [图文]
srcid = 1514 在线文档 - 结构化数据
srcid = 1513 软件下载 - 结构化数据
srcid = 1511 [原创] 星火计划
srcid = 1509 官网
srcid = 1508 单一视频结果
srcid = 1505 百度知道(知道达人)
srcid = 1502 百度百科
srcid = 1501 评分 - 结构化数据

这些结果都是可以用 seo 直接去改变排序的,譬如 srcid = 1511 [原创] 星火计划,百度明显是想让站长亲自写点原创内容,作为 seo 权重的一个元素。
1501, 1513, 1514 等结构化数据也是未来 seo 需要掌握的技能。

F 系列参数与 第 1 类 srcid 的对应关系

F1 = Bxxxxxxx
srcid = 1526 更多文库相关文档
F1 = xxxxBxxx
srcid = 1528 更多知道相关问题
F2 = x8xxxxxx
srcid = 1530 更多贴吧相关帖子

srcid 与 tpl 的密切关系

2014年03月21日在搜外问答回答过有关问题
http://ask.seowhy.com/question/9590

淘宝
srcid = 1509 官网
tpl = se_st_guanwang 搜索引擎_标准_官网
srcid = 1523 robots.txt
tpl = se_st_robots 搜索引擎_标准_robots.txt

tpl(type-link 链接类型) 与 srcid 意义不同,但两者属于亦步亦趋的夫妻关系。

第 2 类 无 F 系列,有 fk

百度搜索产品 百度阿拉丁开放平台合作伙伴

无法获得全部数据,下面只列出部分第 2 类 srcid 含义

百度文库
官微
百度知道
百度百科
百度视频
知乎
topik
医院
腾讯科技
电视猫
系统吧
新闻时间轴
东方财富网
禁止抓取
百度软件中心
京东
系统之家
百度贴吧
新浪财经
寻医问药网
百度旅游
代名词
官网
起点中文网
百度经验
百度站长平台
中关村在线
中公教育
悦美网
人人网
电话联系方式
百度轻应用
好大夫
乐视网
百度团购
品牌词
汽车点评
新浪微博
中国天气网
hao123下载站
百度乐居
腾讯视频
录取分数线
百度口碑
知名网站
融360
手机中国
求医网
豆瓣
国家授时中心标准时间
Mtime时光网
百度音乐
易车网
最佳答案
百度阿拉丁 - 框计算
百度招聘搜索
百度视频
日历
IP地址查询
百度翻译

第 2 类(补) 无 F 系列,有 fk,fk 为空
srcid = 35 百度移动应用
srcid = 2 百度地图

第 3 类 无 F 系列,无 fk
音乐 图片 视频 地图 文库 实时(realtime) 百度汇

部分第 3 类搜索结果来源

百度财富
百度教育
百度健康
百度微购
去哪儿
百度团购
百度地图
百度购物搜索

百度经验
百度文库
百度百科

最新图片
最新微博结果
最新相关消息

百度音乐
百度图片
百度视频

百度左侧知心结果
第 2 类 无 F 系列,有 fk

百度视频
官微 百度知心左侧卡片框内
百度百科 百度知心左侧卡片框内
百度图片 百度知心左侧卡片框内
百度音乐 百度知心左侧卡片框内
百度视频 百度知心左侧卡片框内
百度贴吧 百度知心左侧卡片框内

百度知心左侧卡片框中的键值较为特殊
貌似 Unix 时间戳是生成来源的时间,像刘德华是2013年09月12日 21点56分06秒生成的第 7 个来源,放在人物目录下的基础里。
估计百度每秒限定生成 10 个来源,1 小时最多 36000 个。

第 3 类 无 F 系列,无 fk

百度知心左侧卡片框内来源举例

srcid = 29090 百度教育_热门课程
srcid = 19 最新相关消息

综上因为无法穷尽百度 srcid,而且有的百度搜索产品像百度百科在 3 类搜索结果来源里会以不同的身份出现。所以要依赖 F 系列,fk 辅助判断哪一类的百度百科可以被 seo 改变排名,哪些则对 seo 免疫。

srcid, F 系列,fk 三位一体

用 php 将百度搜索结果页(baidu-serp)的 srcid, F 系列,fk 捏合到一起,就能弥补无法知道所有 srcid 的缺点。

只要能或不能匹配 fk, F 系列,就能将未知的 srcid 归类,具体含义以后能够慢慢完善。

百度没有给 seo 留一丁点把小米手机做到首页的可能性。

联想的 3 类搜索结果来源: 第 2 类平均排名最好,第 3 类次之,第 1 类全部在 11 位以后。
因此第 2 类 优先级高于第 3 类高于第 1 类。
第 2 类中的百度自家产品优先级又高于非百度产品像被百度收购的手机中国,中关村在线等。

百度知心左侧卡片框结果请看《百度越来越人性化!——信息整合》的回复

2014年04月02日更新
百度删除了 srcid = 15883 等引起的 bug,百度快照时间恢复正常。

小米手机第 1 名 20点21分还是第 2 类 srcid = 14545,到了0点56分发现已经被删除了,回到了第 1 类搜索结果来源。
对 seo 而言是利好消息。

参考资料
因为百度搜索结果参数的文章 95% 是鄙人原创发现,在谷歌、百度几乎找不到相关的文章或书籍,所以没文章可读,我也很想看啊。
只好推荐些原创研究百度参数所使用的方法的书籍,其中一些书至少需要大学本科以上文化程度及相关专业才能阅读,请看本人头像即可知读完这些书有多痛苦。

西方哲学
黑格尔 《逻辑学》(Wissenschaft Der Logik)(上卷),俗称《大逻辑》
康德 《纯粹理性批判》《实践理性批判》《判断力批判》,俗称《三大批判》
胡塞尔 现象学
笛卡尔 我思故我在

中国哲学
趙實庵 老子解
成玄英 《道德經開題序訣義疏》
老子 《道德经》

科普
杰克·霍金凯 《无序的科学》
凯文·凯利 《失控》
Albert Einstein Ideas And Opinions

家具设计
明式家具研究
无印良品

词典
陆谷孙 《英汉大词典》
《辞源》

seo
The Art of SEO
昝辉zac 《SEO实战密码》

计算机编程
Thomas H.Cormen 《算法导论》
Paul Graham 《黑客与画家》

请珍惜自己的品牌! 本文质量及原创性由搜外网审核,永久保存。【ID:79】点此查核→

作者公告牌

文艺极客QQ群 255363059

举报 收藏
管理文章:
姬成 · 搜外论坛技术区版主

感谢吴星的无私分享!

邓立博 · I am 门老师,欢迎关注我的微信公共账号:menlaoshi001

感谢吴兄辛苦研究,热情分享

杨彬彬 · 不玩SEO了

啊!表示非常感激!又受教了!

方言 · 建站虽易,SEO不易,且行且珍惜。

学习了啊!

杨彬彬 · 不玩SEO了

第二类说明srcid的时候是不是把对应的srcid少了?

王垚 · 追本溯源

真是受教了啊,感觉突然很了解百度了,对于想要优化的词有了更好的理解。这么一看,seo想要做下去越来越不容易啊。

吴星 · 文艺极客QQ群 255363059

不完整,而且有些 srcid 未必准确,为了节约篇幅,让大多数人能看完,所以没贴。

付科凯 · 资深媒体人,百度站长社区版主,QQ:2786192861,微信:birazon,曾运营大型B2B网站,目前负责某跨境

感谢分享,好东西~

刘易俊 · 我是玩票的

非常感谢!

姜东常州 · 常州SEO,我在常州。擅长CMS站布局,将SEO工作流程化...

@admin 建议搞个收藏按钮,方便查看。类似于“关注”

陈红然 · 尚品网SEO,专注移动端SEO和电商SEO,QQ251725517.

一句没看懂T_T 认真学习中

好牛哄哄的说 就是看不懂

admin · 搜外社区管理员

好的,建议收到。程序还有诸多不完善之处~

沈忱 · 没有执行力的个人站长!SEO工程师 SEO经验2011年起

专业帖子要好好研究下

刘曙 ·

辛苦了,太专业了,谢谢。

吴星 · 文艺极客QQ群 255363059

是很辛苦,一个拿着4000元的工资外链专员,研究出百度许多拿着10000元以上的程序猿在做什么。srcid 很有用。

周超 · 从SEO到网络营销的蜕变

菜鸟学习了,谢谢分享!

王朔 · 网站SEO主管。啥也不会,一个站都没弄成。。。

知道这些参数有什么用呀 是让大家放弃SEO吗

柏如飞 · 中国易维网 seo总监 四年seo从业经验,涉及外贸,医疗,旅游等行业

看着都头疼的

温九龙 · Google优化,Q:2051807103

真心没看懂

蘇棟良 · 四年SEO经验、数据分析。主要领域B2B\B2C\电商企业

很强大,留个记号找个时间好好研究!

杜辉 · 小卒

研究出来了,对实际操作时有什么帮助?就是看一下1599代表的是普通结果,1525代表百度文库,然后呢?看看就行了,有意义么?

吴星 · 文艺极客QQ群 255363059

你可以到百度公司去问他们发明的1599有意义么?而不是来问我。

不错,干货 学习了

杜辉 · 小卒

你研究这个出来后对优化有什么帮助,时能帮你把某个词排名提高到第一位,还是能把整个网站的流量提升起来,一个百万级别的网站,需要做的关键词有几百万,甚至几千万,你一个一个看这个结果,看完后呢?用你这个成果能说明什么问题?不要整天听好听的,突然有人提几个疑问就受不了。

吴星 · 文艺极客QQ群 255363059

4月1号写的这篇文章,至今过去4个多月,网上就再没找到第二篇有关 srcid 的文章。要不你写篇文章来反驳百度 srcid 是没用的参数。

杜辉 · 小卒

请不要偏离话题,我说的是你研究这个,对你提高网站流量的帮助是什么?

吴星 · 文艺极客QQ群 255363059

这只是一个参数,主要作用是区分百度自家产品、百度汇结果、百度阿拉丁合作伙伴、seo 可操控的结果,右侧知心推荐结果,顶部为您推荐结果,其中大部分都是在正常搜索结果中看不到的,也就是百度根本没打算让你看到这些东西。流量是百度让你看到的东西。两者之间没有关系。当然现任公司网站每天从百度带来10万IP,也无所谓流量。

杜辉 · 小卒

感谢说明,不过你说明现任公司网站流量,是想让大家赞你吧?我想问问,是你一个人做的?还是你一个人策划的策略?都用了那些策略?每个策略分别提高多少?又花了多长时间?要说的是这些。

吴星 · 文艺极客QQ群 255363059

我先开发一个工具,然后借助工具来说明什么样的策略是有效的。当然这要花费许多时间。

蘇棟良 · 四年SEO经验、数据分析。主要领域B2B\B2C\电商企业

表示看了几遍还是看不懂,感觉压力很大啊。怎么差距这么大呢。有没有好的方法可以了解这篇文章?

吴星 · 文艺极客QQ群 255363059

weixingon。com/baidusp-f.php?s=seo

吴星 · 文艺极客QQ群 255363059

知道化学元素周期表其实没任何意义。但是把不同化学元素组合在一起,就会有许多想不到的用途。知道百度 srcid 同样不会带来流量,但是和其他百度参数结合起来,就有意义了,觉得这就是读书读少的区别。

杜辉 · 小卒

读书再少,也比没素质强。要是你研究这个这个对提高网站流量有帮助,我啥话也不说,怕人提出异议就有些受不了,就进行人身攻击,你的素质还真不错。

吴星 · 文艺极客QQ群 255363059

你和几十家拒绝我做 seo 的公司老板、HR 差不多,都是一类问题。但如果不是我在连续面试seo失败62次后继续坚持下去,根本就不会有这篇文章出现。觉得你的问题只是不承认seo 可以发展出另一个领域的东西。

江飛 · 廣州易遊網絡科技 SEO工程师 SEO经验3年(主要負責遊戲平台以及公司旗下各個遊戲官網的SEO優化,,遊戲受眾為港

不知道吵什麼。這篇文章其實只是作者寫出自己的發現。。
1.到底這個發現以及作者總結是否正確,無從考證,所以沒啥好爭論的。
2.作者只是講發現,,沒有講如何運用到實際操作中,或許本來就無用。,文章的價值,大家仁者見仁。
3.我慚愧沒看懂啥意思。而且我個人表示無所謂看不看得懂,從不研究算法。站在用戶角度合理運用SEO技巧。提供有價值內容和實用的web應用即是最好的SEO。
4.END。。。

吴星 · 文艺极客QQ群 255363059

我平時寫字就喜歡用正體字(繁體字),看你的回答覺得很親切。

江飛 · 廣州易遊網絡科技 SEO工程师 SEO经验3年(主要負責遊戲平台以及公司旗下各個遊戲官網的SEO優化,,遊戲受眾為港

我們公司是做港台的,所以系統都是繁體的。

周勇 · 80后屌丝男,一直想逆袭却从未成功

我表示看不懂,不要笑话我

谭阳喜 · 80后,爱学习,爱IT,爱音乐

不错,谢谢分享