搜索引擎——我们反对人工干预

来源:互联网 发布:java编程思想电子书pdf 编辑:程序博客网 时间:2024/06/10 04:31

Google搜索排名首席工程师阿米特·辛格尔


  腾讯科技讯 北京时间7月14日消息,据国外媒体报道,Google(谷歌)搜索算法技术团队首席工程师阿米特·辛格尔(Amit Singhal)近日在该公司官方博客中称,Google搜索排名一直遵循着三项原则,其中一条就是坚决反对人工干预搜索结果。


  以下为辛格尔阐述Google搜索排名三原则全文:


  今年5月,Google工程开发部门副总裁尤迪·曼博尔(Udi Manber)对外介绍了Google搜索质量部门的相关情况,该部门主要负责对互联网搜索结果进行排名,部门下面建有多个团队,其中包括核心排名团队、国际搜索团队、用户界面团队和评估等其他一系列团队。在这里,我想重点谈一下Google核心排名团队。


  首先自我介绍一下,我叫阿米特·辛格尔,目前Google负责搜索排名团队的各项事务。过去18年中,我一直从事互联网搜索业务领域的研究工作。1990年我正在攻读硕士学位,正是从那年起,我开始接触互联网搜索业务。在学术界,搜索又被称为信息检索。在担任了10年信息搜索研究员后,我本人于2000年加盟Google,并一直从事搜索排名工作至今。


  Google搜索排名实际上是一整套算法,用来查找与用户查询内容相关度最高的文档。我们每天要对海量网页进行数十亿次的查询,而每一次查询都需要使用这套算法。虽然网页搜索是访问量最高的互联网搜索服务,但其他搜索业务也使用这套算法,如图片搜索、新闻搜索、视频搜索、地图搜索、产品搜索和书籍搜索等等。


  在搜索排名问题上,人们平常向我提出最多的问题是:“你们究竟是通过什么方式来完成这项工作?”当然,我们首先要建立一套先进的排名系统,这点我会在后续博客文章加以详细介绍。今天我就先简单介绍一下Google搜索排名的三大原则:


  一、成为全球相关性最高的搜索引擎


  二、简洁性和易用性


  三、不得人工干预搜索结果


  对于第一条原则,显而易见,考虑到我们对搜索业务的高度热情,Google绝对要确保每位用户都能获得相关度最高的搜索结果,我们将其称之为“不落后”原则。对于来自任何国家、任何语言的搜索,如果出现Google所提供搜索结果关联度不高的情况,这只会会激励我们进一步加以改进。


  就第二条原则来说,其实不仅仅是Google,任何系统架构师都希望自己系统能够简单易用,搜索系统同样如此。由于我们需要处理来自全球多种语言的搜索,因此很容易使系统变得异常复杂。在这方面,在保证搜索质量前提下,我们需尽量保持系统的简洁性和易用性。这是一项需要持续改进的工作,它也值得我们为此付出努力。每周我们要对排名系统进行10次改进,每一次都要确保其简洁性。这套简单易用的系统其实还有利于创新,各种事实也证明了这一点。因此,产品简单易用性确实很重要。


  在谈到搜素排名时,如果不谈及“是否进行人工干预”事宜,那肯定不是完整的讨论。人们经常会问:“Google是否通过手工方式对搜索结果进行了干预?”我对此的问答是:Google坚决反对人工干预,这也正是我们的第三条原则。在Google看来,互联网由公众所创建,正是无数个网民创建了数量众多的网站和网页。我们的算法也正是为了对人类智慧加以更好利用。搜索结果的最后排序应由互联网社区的使用情况及我们的算法来决定,因此无需人工干预。我们相信,任何个人的主观判断将使影响到搜索结果的客观性……由此可见,通过搜索算法自动排名质量远高于人工干预排名。


  我们反对人工干预的第二个原因是:只要出现一次失败的查询结果,就意味着我们需要对搜索算法进行改进。改进搜索算法不只是提高这一次搜索查询结果,而是要提高整体查询结果的质量,且对全部语言搜索都有效。但这里我要补充一点,我们对所推荐的网站有明确规定,对于一小部分违反相关政策的网站,我们将采取干预行动,如违法、含有儿童色情内容、存在病毒和恶意软件的网站等。


  在本人的后续博客中,我还将对Google搜索排名事宜进行进一步讨论。总而言之,我们对搜索业务的热情比以前进一步高涨。(编译/中涛)

0 0
原创粉丝点击