各个搜索引擎都有自己的数据库,就是用来查重的,
百度自己把之前的文章进行收录,然后把你那篇拿来对比,重复性多就不是原创
蜘蛛爬取了你网页的数据之后就会待会百度的数据库,进行和其他网站的数据进行对比,相似度高了就是所说的伪原创,相似度特别低的会判做原创。
就跟论文查重一样,有自己数据库
百度有一种文章指纹算法 专门比对重复度的
百度他有自己的数据库
5118可以检测一下
让更多人参与回答