网络信息越来越多,同质化越来越泛滥,只要网上还能找到的页面,就会被复制出一个类似的页面,就连内容都极其相似,越来越多的内容被伪原创,别人的抄袭和伪造速度远远超过了蜘蛛的想象,当他在所有的页面中抓到的内容都不尽相同的时候,还怎么判断哪个是新的,那个是造的。
确实难,现在不知道怎么了。收录慢了很多
让更多人参与回答