是我的原创文章,每次我更新到自己网站上,然后就被人恶意采集走了,一次次的采集让人心烦,怎么回事呢?为什么还是被人恶意采集走了,别人的都收录了,这样会影响我的收录量,我怎么不让人继续被采集走了?
防止代理IP模拟搜索引擎抓爬:使用代理IP是一种常见的数据采集方式,因为它可以隐藏真实的IP地址。但是,网站可以通过蜘蛛IP和UA定义拦截代理IP的抓取,从而防止代理IP模拟搜索引擎抓爬。 屏蔽分类页,放行蜘蛛:网站可以屏蔽分类页,从而防止一些数据采集者采集分类信息,但是需要放行搜索引擎的蜘蛛。 URL不规则加密:采用MD5方式加密URL可以有效地防止数据采集,因为加密后的URL是一段固定长度的字符串,无法被人类直接解读。数据采集者需要通过计算才能得到真实的URL,但这需要花费大量的时间和计算资源,降低了数据采集的效率。此外,可以使用不同的加密方式,增加解密的难度,进一步提高安全性。
很难完全禁止的这个
禁一下IP吧,虽然没有什么用
举报反馈,也可以加防复制代码,不过用处也不大
让更多人参与回答