谷歌联合创始人谢尔盖·布林访谈

作者:Jason Schumaker
Interview with Google's Sergey Brin

Google,http://www.google.com/,是当今互联网上最热门的搜索引擎(参见Doc Searls的“Google Gains...”文章,第10页)。它速度快,并且始终如一地返回相关链接。该公司由谢尔盖·布林和拉里·佩奇于 1998 年创立。两人合作开发了一种名为 PageRank™ 的新型搜索引擎技术。自那时以来,Google 聚集了相当多的追随者——Yahoo! 最近聘请 Google 为其搜索引擎提供技术支持——现在拥有链接超过 10 亿个 URL 的能力。我与 Google 的联合创始人兼总裁谢尔盖·布林进行了简短的交谈。

Jason: 是什么促使 Google 决定使用 Linux?那是从什么时候开始的?

Sergey: 嗯,拉里·佩奇和我在斯坦福大学计算机科学博士项目学习。我们在那里开发了 Google。计算机科学项目的运作方式是,周围堆放着各种各样的计算机设备,我们会抓住我们能找到的任何零散部件。我们有各种各样的计算机:运行 Linux 的 HP、Sun、Alpha 和 Intel。因此,我们积累了所有这些平台的丰富经验。

当我们创办 Google 时,我们必须决定我们想要使用什么。当然,我们选择了 Linux,因为它是最具成本效益的解决方案。

如今,PC 不仅便宜得多,而且我们还可以非常快速地获得它们,因为它们是如此常见的商品。这是一个令人难以置信的好处。我们刚刚安装了另外 1,000 台计算机,我们在几周内就完成了。对于任何其他类型的工作站来说,这真的很难做到。我认为这是人们没有完全意识到的一个优势。

Jason: 您认为它更好,还是成本是主要原因?

Sergey: 在某些方面它更好。当然,就我们的目的而言,我们觉得支持更好。例如,实际的内核作者会很快响应问题。他们对 Google 的响应尤其迅速,因为我们被如此广泛地使用。我们可以在 15 分钟内得到答复。对于支持来说,你真的无法超越这一点。

这是一个重要的因素,但坦率地说,成本是一个更大的问题。PC 非常便宜,这非常重要。Sun 的 Solaris 可能比 PC 上的 Linux 更稳定。很难确定责任归属,是硬件还是操作系统。但是,这是一个很小的差异。

Jason: 那么,您的所有支持都来自新闻组,还是您实际上通过 Red Hat 付费获得支持?

Sergey: 我们有一个大约十人的运营团队,这有很大帮助。除此之外,我们还会查看新闻组并通过电子邮件联系代码的作者。通常,如果这是一个我们无法解决的问题,我们会直接去找作者。

Jason: Linux 在 Google 的台式机上使用吗?

Sergey: 这取决于情况。工程部门主要运行 Linux。业务开发/市场营销部门运行 Windows。实际上,我使用 Linux 和运行 Windows 的 VMWare。有些人有两台电脑,特别是工程部门的一些人,他们进行 UI 开发并且需要在 Windows 平台上测试东西。我发现最好只使用 VmWare 并拥有一台电脑。

Jason: 从技术意义上讲,Linux 缺少什么?它不提供什么?

Sergey: 64 位文件系统,我知道他们正在开发。它正在慢慢出现。我认为偶尔仍然存在一些稳定性问题。我并不是说 Linux 在这方面是独一无二的,但你肯定希望具有可靠性。在处理更高内存的系统时,存在一些问题。如果你达到 2GB,并且你试图将其推过那个限制,我们会遇到各种问题。我知道当我们真正努力推动网络堆栈时,我们遇到了一些麻烦。就丢失了来自许多不同机器的大部分连接而言。

Jason: 嗯,你们每天的点击量相当大,不是吗?

Sergey: 是的,我们是。我们在 Google.com 上每天进行大约一千万次搜索。还有来自 OEM 客户的约六百万次搜索。所以,我们获得了大量的点击量。当我们抓取 Web 时,我们抓取速度非常快,这真的会给系统带来压力。

Jason: 您的系统是否完全宕机过?

Sergey: 没有,但我们肯定有个别计算机宕机。我们的系统内置了大量冗余,因此用户从外部看不到它。

Jason: 我读到你们开发了自己的网络安装工具...

Sergey: 是的。我们重复使用了人们构建的各种组件;我们现在不得不自己重新做很多。我们现在有 5,000 台计算机,而安装这些计算机实际上需要相当多的工作。因此,我们有自己的网络安装系统——我们可以一次启动 80 台计算机。我们有自己的测试软件和监控工具来跟踪计算机正在做什么,它们处于什么状态。所以,我们不得不进行相当多的开发。

Jason: 在 Google 使用的 5,000 台计算机中,您能否大致细分一下它们的用途,例如,3000 台执行搜索,1000 台用于 OEM,500 台用于网络爬网等?

Sergey: 在不给出具体数字的情况下,我们可以说大约 80% 的机器用于执行搜索(google.com 和合作伙伴);大约 10% 的机器用于研发,另外 10% 的机器用于预生产(抓取和索引网络)。

Jason: 这些工具值得发布到开源社区吗?

Sergey: 这是一个有趣的问题。我的意思是,我不知道有多少安装规模与我们的相当,但既然你提到了,这当然是我们会考虑的事情。我认为它们目前都没有足够强大或足够干净。但是,我认为如果其他人接管维护并做出贡献,我们可以使它们达到那种状态。我只是认为最终会使用它们的人不会太多。

Jason: 您能否简要介绍一下您自己,以及您是如何来到 Google 工作的?

Sergey: 我出生在莫斯科,六岁时来到美国。我在马里兰州长大,然后去了斯坦福大学的计算机科学项目。我于 1993 年在那里开始工作,研究数据挖掘,这基本上涉及分析大量数据以找到有趣的关联和模式。然后拉里在 1995 年加入。他开始下载 Web,我们分析了它的链接结构。从那时起,我们就一直在一起工作。

Jason: 好的,非常感谢您抽出时间。再见。

Sergey: 谢谢你。

Interview with Google's Sergey Brin
Jason Schumaker (jason@ssc.com) 在 Linux Journal 工作了将近两年。他是助理编辑和一名专职作家。
加载 Disqus 评论