百度如何判断谁是文章的原创作者?

现在很多行业中都存在一种现象,一篇原创的文章,很快就被转载到各个网站,像文章中留的锚文本,网址等信息都被去掉了,百度是如何判断谁是文章的原创者.
说法1、从时间上判断(网站上的发布时间站长可控,不可靠,蜘蛛爬行到的时间,也不可靠,高权重的网站蜘蛛一直都在,转载文章可能先被百度爬取到)
说法2、文章的外部链接(这应该站长也可以控制)
说法3、做好内链.(比如说像有更新机制的,有专题聚合的,很容易就产生很多内链)
大家站在百度的角度去想想还有什么方式可以判断你是原创?

追加问题
    9 人参与回答
谢跃龙
谢跃龙 · SEO=思路+执行
李文蒙 等 1 人赞同该回答

个人认为,蜘蛛抓取编写的文章后算是原创的文章,但是原创的文章也未必能排到第一位。百度会综合评比对网站页面的权重进行分析给出排名
例如1:一些大型网站采集一些文章,文章照样能排在前面
例如2:把原创的文字发到一个垃圾网站,收录会很慢或者长时间不收录

杨波
杨波 · 创造梦想,成就梦想。这就是我蜗牛
施赛健 等 1 人赞同该回答

网页PR值。网页PR值越高,被认为是原始版本的可能性就越大。

网页第一次被收录的时间。网页被搜索引擎收录的时候越早,相比后发现的相同内容的网页来说,被当作原始出处的可能性就越大。

域名注册时间。越老的域名上面的网页被当成原始出处的可能性也越大。

网站的权威度。这就有点说不清了,可能包含前面3个因素,还有很多其他因素。

城堡
城堡 · 做了个新站,来晾晾

 通过提交和抓取对比

百度看不出的,不然出什么原创保护。还有各种举报采集的活动

施赛健
施赛健 · SEO爱好者,上海捷思工厂负责人,德国诺克、美国福维斯发电机品牌总代理。

搜索引擎如何判断一个网页是原创的
1、如果搜索引擎收录这个页面时,他的数据库里都没这篇内容,则说明是原创的;
2、如果某个网站,曾经发的绝大部分内容都是原创的,则新发的内容也很容易被认为是原创的;
3.网站的权重值,蜘蛛抓取频率等 应该有关系

李文蒙
李文蒙 · 日月逝矣,岁不我与

楼上谢跃龙的说法差不多。

个人认为,蜘蛛抓取编写的文章后算是原创的文章,但是原创的文章也未必能排到第一位。百度会综合评比对网站页面的权重进行分析给出排名
例如1:一些大型网站采集一些文章,文章照样能排在前面
例如2:把原创的文字发到一个垃圾网站,收录会很慢或者长时间不收录
HTML5中有个时间标签但好像可以作弊实现,至今没有实践验证,基本就是先抓取的为原创,即使真正原创作者也有可能不会有好的排名。愚见。。
大海
大海 · 予学SEO 技术总监 专业承接企业SEO外包服务 http://yuxue.org/

准确的说目前百度还做不到这么精准!
依靠收录文章的时间和标题以及内容的对比一个条件吧!
另外最重要的是该网站的权威性!
如果老站有可信度的话即使转载一样可以活的很好的排名
不过现在搜索引擎是鼓励原创,打击经常抄袭不带来源的网站。

李诚
李诚 · SEO实践者

1.文章第一次抓取时间,抓取数据库对比.
2.文章外链数量,转载数量
3.文章若被转载,但是有内链转载后是失效的,可以根据此内容来判定.
4.发布平台权重.
个人认为有以上几个要素,当然肯定还有很多因素在其中.也希望大家讨论能找到更好让百度知道原创的方法.

谢恒崧
谢恒崧 · 90后IT男,SEO爱好者

百度原不原创视蜘蛛而言,权重高,蜘蛛爬行就越频繁,爬行收录了在数据库里面,就视为原创了,而蜘蛛终究来说也是编写出来的程序,而我们能做的就是提高网站权重,也让蜘蛛像高权重网站爬行频率一样~