搜外网>搜外问答>问答页面

关于百度分词技术

关于百度分词技术 想请教个问题 中国棉纱线网 是不是可以分成 棉纱 纱线 纱线网 中国纱线网 中国棉纱 中国棉纱网等 期待您的答复 谢谢

追加问题
    3 人参与回答
艾佛而
艾佛而 · Search

搜索了一下,楼上的分词应该是谷歌的分词技术,百度是分成了中国、棉纱、线网。每个搜索引擎分词技术有所区别吧。

李 凯
李 凯 · Focus on the user experience,not seo

我个人理解啊,分词是分成最小的单元,然后去除掉噪声词,根据语义进行不同词的权值的匹配。最后就是进行索引的时候,进行不同的匹配展示。

你的这种就不是分词,我觉得更多的是匹配。如果是分词的话,应该是中国 、棉纱线、 网(这个属于语义最小化,其它两种分法,不列举了),你的更像是要把分词后的最小单元按照搜索词进行匹配。这种匹配那就是模糊了,你可以随意匹配,但是不同组合代表的权值是不一样的

SEO培训招生中
155