百度分词算法详解

安梵希
安梵希

发布于 2017-12-22 14:37

182 浏览
0 评论
微笑最近在一些SEO讨论的大杂会听到很多有关于分词的话题,今天微笑就谈谈什么叫分词,百度是怎么样分词的;在我们亚洲最少就要有三个国家需要分词:中国,韩国,日本;作为全球最大的中文搜索引擎—百度更要在中文分词的处理能力上要具有技术和优势。


分词作用:

1.文本挖掘:把文本类型的信息源作为分析的对象利用定量计算和定性分析从中找出信息的结构,模型,模式等各方面的隐含知识并对用户来说是有需要的。文本挖掘的复杂层度很高有信息抽取,信息检索,自然语言的处理还有数据处理等,再从提取出来的信息当中选取未知的知识。www.urospa.cn

2.语议识别:中文的语义别识难度远远超过英文,比如同一词语在不同语境的情况下所表达的意思是完全不同的;写到这里微笑有点怕的就是像文本挖掘一样要了解的知识点实在太多,如果把这两个点表达清楚的话所需要字数不在万下,作为一个SEO你需要大概的了解就可以,如果真的要深究的话那么可以跟微笑一起交流。

本来想着还写几点关于百度的分析算法,但想到就这一篇文章所涉及到的专业知识实在太多,大家如果要搞懂这两个知识点的话真不容易,今天的文章百度分词算法就在此处。下次在微笑SEO这个栏目上再接着写,不会太监请放心。

举报 收藏
管理文章:
暂无回应