你们是如何看待百度保护原创的? 推荐热议

今天所有SEO相关的平台似乎都被百度保护原创的内容给覆盖了,看来,这次百度真的要亮剑了,打击作弊外链,保护原创,这早已是很多白帽SEO的呼声了,但避免不了还有很多反对的声音。

那么,小伙伴们,你们是如何看待百度保护原创的?

回复讨论点:
1、对于原创文章在搜索结果页是否应该加上 原创 标识
2、什么样的文章才算是原创?比如引用了其他文字的一句或一段话是否还是原创?
3、如何避免假原创或机器生成的文章?
4、根据一个网站的原创率是否应该进行整体权重加分或减分?
5、对于网站来讲,原创文章和转载的高质量文章孰重孰轻?
6、如果你是百度工程师,如何去识别原创?

更多讨论详见http://bbs.zhanzhang.baidu.com/thread-20443-1-1.html

追加问题
    12 人参与回答
清文
清文 · S 不 EO
黎亦峰叶景三木焦点老代 等 5 人赞同该回答

看到这个消息 感觉百度 胆太肥了 应该只是 说说罢了吧 说给站长门看的吧 想体现下自己的责任感罢了吧

1、
单靠技术来识别一篇文章是不是原创 太不现实了 任何技术团队都无法做的到
一个标示 展现的是 一个判决
我相信 他不敢这样做 这样做的后果就是带来很多 冤案 张冠李戴
百度没有任何权利和能力来判决版权纠纷案
比如 一篇 非常重要的学术性文章 从未在互联网出现过 结果被人弄到了 某网站上
结果百度 给这个网站的这篇文章标示了原创 这样就不是在保护原创了是在扼杀原创
那么就会有人控告百度......

但是要想估算 整个网站的原创比例 还是有可能的

2、理论上相似比低于30%的 就是原创 。记得大学毕业的时候 学校规定 重复率低于30% 就是原创,各大杂志社投稿 ,相似比要求 也是在10%到30% 也就是说自写率 在70%到90%。具体可以参考 知网检测系统神马的。。。非常牛逼 基本的算法是 比如 把一篇文章分成N句 没一句13个字 13个字中有7个字相同 那么这句话就是抄袭 然后循环来计算出全文的相似比。就算你拿到一句话简单的伪原创 都是没任何意义的。但是这个回到第1、 所以不一定算原创了 只能说 相似比低于30%的是稀缺资源愿
到是 可以给这样的文章 标记为 ** “稀缺文章”**

3、机器生产的好 那么就没必要杀。 生产的差 将全体现在用户体验上和 语义分析上了 提高语义分析能力 加上在用户体验上的判断

4 5 6

我始终觉得不应该 把原创文章 更多的权重排名
应该是谁出的力多 更推广了这篇文章 就更有排名好的优势 一个原创的内容没有好的展示给更多的用户,那这个原创文章的价值何在? 占着茅坑不拉屎。

一个大型的门户网站 用户群体多 每天需要大量的各种文章来给用户阅读 他不转载怎么搞?自己怎么可能能写那么多原创。。你不准他转载 ,最后苦的是用户 因为用户找不到什么文章来看了。

再说 搜索结果排名 如果你仅仅是原创 就排名好 那么你的网站布局很差 用户体验很差 用户进来看完这篇文章 直接关闭网页 去别人网站 你还排名好 这样 不是亮瞎眼睛么 消耗用户的更多时间成本么

你一篇文章是转载的 用户进来 看了一篇 又一篇 满足了用户N多需求。。。这样的网站才应该排名好。。

用户需要的不是 在百度上 东搜一下 西搜一下 浪费N多时间来 看原创文章
而是需要在一个平台上看到 管你是不是原创的N多优秀文章!

最后总结就是:只能从整体上来判断一个站是不是采集站 而不能从单一的一篇文章来看是不是原创
因为 要想判断原创 再等20年
所以如果我是百度工程师 如果硬要保护原创 我目前只会做一件事情:采集站 转载方必须 附上转载来源地址 这样就顺便给他做下推广 在原有的算法上也是对这个网站增加了权重 也是对原创贡献的一种保护 不附 就直接弄死 新浪也不例外
到时候我们就可以看到 很多大站 上有我们小站的 外链了 哈哈哈哈

林林
林林 · 爱好不止是吃饭、睡觉、打豆豆的90后

两个字“支持”,三个字“很支持”,四个字“非常支持”。我维护的企业站隔三差五的会写些自己对产品的见解,或者是整理些某个行业可以选择的货架类型,可是每次一发布就会被别人转载去,其实转载去也没有什么,重要的是别人的被收录了,可我的网站文章迟迟不被收录,更可气的是这个站还是新站。还有就是我写的公司案例新闻就这么被别的同行转去,如果不标注的话,客户会以为那是别人的案例的,可是如果标注原创,这样不但让原作者得到保护,而且会让更多的人想方设法去创造内容。对于缺乏原创内容的互联网时代,跨出这一步是很难得的。因为不是每个人的素质都很高,要求你这样做他就这样做,所以采取点惩罚措施还是很有必要的。纯属个人观点,不喜勿喷!

陶德进
陶德进 · 酷哆网最棒

百度的技术,国内政策对国内搜索引擎的保护,注定百度在未来的一段时间内,仍然是占有率第一的搜索引擎。好搜、搜狗、神马等搜索引擎,总是吹捧自己的占有率达到百分之几十,但是对比手中的几十个站的搜索引擎流量来源,都是无法和百度比较的。所以无论如何,我们被迫还得做百度SEO用户体验和移动化是未来几年SEO重点,同时集中在用户体验,尤其是高价值的内容。
语义识别、词频、长句子匹配百度搜索结果设置阀值、切词等,比对百度库文件、百度设置的阀值决定你是否是原创或者伪原创

站长微论
站长微论 · 某电商平台运营主管,7年网络营销实战经验,与大家分享。有问题加我的微信号“zzwl111”

原创一个号陌生的词,做了啥,还得立牌坊

杨敖
杨敖 · 5年SEO经验,3年SEM经验

呵呵 这是百度公布安抚我们的么 ?

说原创,感觉蛮扯淡蛋的。原创识别不易,然后不支持转载,就是拒绝分享。影响了好的东西传播的速度!

刘志仕
刘志仕 · SEOWHY版主,擅长:SEO实战、大流量网站运营。微信:673672871

能很公正、准确的加上原创标识,既是百度的进步,也是站长的福音。但如果技术不成熟,标示不准确,会造成很多“冤案”。感觉目前百度想一步到位精准判断不太可能,君子条约(转载带链接)不管用,还不如来个硬性规定,转载别人的文章,必须带版权链接,否则就有抄袭降权的风险。

张鹏阳
张鹏阳 · 许昌互联互动网络科技创始人

截止到现在,我真是没发现,百度重视原创;相反的,随便的复制粘贴一篇文章就能被收录,

吴飞
吴飞 · SEO从业者

1、既然是原创内容,它的发布时间应该最早的一个,可以通过发布时间判断,但是百度针对收录时间不是发布时间,有些难度。
2、文章质量高低,能否满足用户需求,一个文章是原创对用户没有帮助,估计百度不会给高权重。

林宗富
林宗富 · QQ:1223836293 百度站长平台版主之一

我是这认为的:原创也分两种:高质量原创另一种是低质量原创,高质量原创是针对用户的需求性出发,根据用户的搜索习惯来进行编写文章的质量,另一种低质量原创性文章,就是通过各种方式来骗取搜索引擎获得良好的排名和用户的点击,导致本网站得到一定的惩罚,这些文章一般都是通过整合做出来的文章,所以也可以属于垃圾内容的一种吧。说起怎么保护的?可以在网站上注明一些信息,来表明对站点原创进行一个解释。说的不好 请指明

仲彪
仲彪 · 在寻找南京8K-10K的工作

这才算是SEOer真正发出的问题,值得讨论和研究。

胡多钱
胡多钱 · 科技自媒体,网络推广,品牌推广、建设,4年从事经验

目前的原创就是马虎眼,怎么说呢?
1.没有原创标识权限的网站并无作用
2.什么网站具备原创标识?
3.新站/小站出道然并卵
4.试运营何时普及是难题