是数据库中有一篇文章相似就判为非原创,还是有很多篇文章相似才判定非原创?
这个算是百度的核心之一了,一般人难触摸
原创这个其实很少的,但是现在非原创百度也会收录,主要看你整个网站,有一定的原创,然后整体质量比较高就行了
先抓取文章,然后分析处理,再去跟数据库中的文章对比。具体多少算原创应该是动态的,因为有些行业内容少,哪怕全采集的收录各方面都不差。
抓取完你的数据 再拿过去跟数据库的文章对比 相似度特别少就是原创吧~
让更多人参与回答