搜外网>搜外问答>问答页面

火车头大量的采集怎么避免文章重复?

文章重复率太高了,是和前段时间采集有关系,为什么采集之后,查询很多都有重复,以前也没有注意,这是什么原因导致的,火车头采集文章有避免文章重复的方法吗?为什么会重复的内容很多?

追加问题
    7 人参与回答
丫丫
丫丫 · 唵嘛咪叭咪吽

这个只有通过采集规则来屏蔽了~

微眠浅笑
微眠浅笑 · wwwwfyxbcn

没啥办法,因为采集的内容会被很多人重复利用,只要中间加点其他的信息,就没有办法去重,只能人工去重

可以试试开启重复标题不发布,或者是采集之后对文章进行改写,5118的智能改写工具每次改写后效果会有不同,这样也算是在一定程度避免了文章重复发布的情况

在发布的时候开启重复标题不发布,我一直都是这样做的,

天行健咨询
天行健咨询 · 精益生产管理与六西格玛管理咨询,培训机构

您好,在同一站点分类下的规则使用同一个网址库 您的意思是要每次运行这条采集规则都会重新采集不检测重复网址对吗?
编辑规则 > 第一步: 采集网址规则
网站编码右边有一个 检测重复网址 复选框 取消勾选就不会检测重复网址了

没使用过···

祝福语
祝福语 · 一个自学网站优化建站的新手站长。

不改文章标题就行了,在发布的时候开启重复标题不发布,我一直都是这样做的,