Google如何对付抄袭内容
Google对频繁更新的站点的收录速度是非常迅速的,差不多去年的时候突然发现,对于我新发表的文章,曰5~10分钟后就可以用google 搜索到。 这种快速的收录带来的一个最大好处是,google可以通过内容在互联网上出现的时间更加有效地判断哪些是原创内容(更高权重)哪些是转载的内容,进而在未来的搜索结果中优先展现被认为权重更高的内容。
一个非常直接的例子,是我昨天写的“SEO自动化?”一文在google上搜索“SEO自动化”时候的变化过程:
- 文章发表5分钟后,我可以用google搜索到我的文章,位于第2页的下方。 结果首页主要是“SEO工具软件和SEO自动化- 搜索引擎优化SEO每天一贴”和一批转载他的文章,排在最前面的应该是这片文章的原创blog的链接。
- 今天早晨(8小时后), 我的文章排在google结果页面的第一页第4条。 比较有趣的是一个内容聚合站点的我这篇文章的聚合页“玩聚SD | SEO自动化?”排在第3位。
- 下午(20小时后),我的文章排在第一页第一条。
感兴趣的朋友可以自己看看现在在什么位置。 baidu里面还没有出现,这可能因为baidu的收录速度较慢(差不多google 2年前的水平吧)过几天再看。 在live, yahoo search中这些内容也还没有出现。 很显然在这方面google还处于绝对领先的状态。
看到两篇文章“从Google收录速度之快背后看到的”,“从《Matt Cutts谈搜索引擎排名、网络垃圾和搜索的未来》学到的”, 里面有相关的更专业的说明。
到我的blog来的search engine流量中baidu是大于google的,说明中文用户中baidu的用量还是大于google. 但目前baidu的技术还需提高才能更有效对付互联网上抄袭泛滥的问题, 而这个抄袭问题最严重的地区就是中文互联网。
从这个角度看,实现一个行之有效的SEO自动化工具对原创内容的作者来说是个有益的事情,如果收录速度是未来搜索引擎的一个用于衡量内容权重的因素,那么如果因为SEO不够而导致被收录速度不够快,内容被判断不够权高,那么反而垃圾抄袭站点会获得更高的权重。
这个周末如果我前面的东西折腾好了,也许我会出手写个试验的程序来进一步验证想法。 在此以前,我准备把我理解的seo自动化的规则在blog上整理一下,因为这些规则是关键。
这个工具的名字都想好了,就叫FooSeo, 本来想叫Fool Seo, 寓意为 seo 傻瓜版,但想来觉得Foo更geek一些,兼具一定程度上fool的感觉,就叫FooSeo吧。 :)
Related posts:
- Google Wave, I am NOT impressed - 给Google Wave Fans们泼些冷水
- Google Ditu更新的很棒
- Google latitude用户在旧金山抗议GFW暴政
- GAE支持了Java, Cron tasks
- Some Django tips, 以及如何在GAE环境下部署reusable app/lib
- Google Reader新增comments,一个早该有的但仍然不完善的功能
- 升级GrandCentral 到Google Voice . . .
- Joke: Brick VS GAE
- Gmail 故障了...
- GAE去掉了该死的high CPU requests ! 但...
Search related in web: