5118输入域名后就可以查询到站点的关键词排名,是如何实现的?
查询出来的词并不一定都是站点tdk,而且有部分切词和拼接技术。
现在能想到可以达到类似结果的方法有两种:
1.site百度结果,提取前两页的tdk,进行切词之后拼接,然后把拼接后的词在百度中再次搜索查询,返回该网站排名结果。
2.自己建立词库,相应词条对应各自的词库,根据网站tdk进入相应词条,然后遍历一遍词库在百度中的搜索结果,返回该网站的相应关键词排名。
但是第一种开多线程也会很慢,且切词拼接需要一定的nlp技术,比较难实现;第二种,如果关键词多的话,遍历词库也会很慢。
大家有没有什么其他的方法呢?或者,知道5118实现该方法的原理呢?