Google与垃圾网站之间的战斗
Matt Cutts又出了篇新文章《利用数据与网络垃圾作斗争》
http://www.googlechinawebmaster.com/2008/08/blog-post.html
- “…每当我们创建新的衡量指标时,很重要的一点是能够审阅我们的日志数据,并利用先前的查询或搜索结果生成衡量网络垃圾的新的指标。我们使用搜索日志实现“时间回溯“,看看谷歌几个月来在用户查询方面改进了多少。当我们建立了一个新的指标能够更加精准地衡量一种新型的网络垃圾时,我们不仅可以跟踪今后我们阻击这种网络垃圾的进展情况,更可以使用日志数据分析我们在几个月前甚至几年前对同一类型网络垃圾的处理效果。…”
时间回溯,这样来检查算法更新对用户查询方面带来的改进确实是好办法,就像是软件开发中的调试,通过错误或者偏离的结果来调整。 - “IP和cookie信息非常重要,它们能帮助我们把这种方法的应用范围仅限于“合法“的用户搜索,而不是那些由机器产生的搜索以及其他虚假搜索。举例来说,如果一个自动程序一遍又一遍地将相同的查询发送至谷歌,那么在我们衡量用户看到了多少网络垃圾之前,就应把这些搜索查询剔除出去。所有这一切——日志数据、IP地址和cookie信息——都会让您得到的搜索结果更纯净、更相关。”
大量的模拟搜索确实会对搜索结果产生影响 - “去年,谷歌的索引体系遭遇了来自.cn顶级域名的网络垃圾的疯狂攻击。一些网络垃圾制造者大量购买廉价的.cn域名,并在这些网站上堆满故意拼错的词汇和色情词汇。资深的用户可能还记得曾经读过几篇与此相关的博客,但绝大多数普通用户甚至可能从来没有注意到这些。普通的搜索用户没有注意到这些异常搜索结果的原因,是因为谷歌及时识别出了这些.cn网络垃圾,并通过一个快速跟踪项目,很好地应对了此类网络垃圾的攻击。如果没有日志数据帮助我们识别问题发生的速度和范围,可能会有更多的谷歌用户受到此类攻击的影响。”
cn域名确实被钉上,而且被处理,那被误伤的cn应该不计其数,怪不得我们的cn域名试验也被封杀,所以建议大家多花点钱购买com,net,org域名来建设网站做SEO,不要贪便宜,cn域名1元的策略只会毁了他。
Google花了很大精力在提高搜索质量这块,现在查找各种结果都比百度要精确,百度还不创新,市场占有率就肯定下降,Google如果这个时候利用好机会公关,很有机会引发一场占有率的大战。如果搜索引擎能够多几家竞争,对于我们SEO圈是一件大好事。