EOF - 极限 Linux:并非遥不可及

作者:Jason Pettit

就在一年多以前,关于 Linux 的普遍看法是,该操作系统只能可靠地扩展到 8 个或 16 个处理器。这种普遍认为 Linux 在可扩展性方面受到限制的观点,阻止了许多用户考虑将其作为其最大型企业和最复杂技术应用的基础操作系统。对于那些希望在每个环境中的每个平台上利用开源软件优势的人来说,这是一个令人失望的限制。

一年时间能带来多大的改变。在那段时间里,Linux 开发社区和系统供应商取得的各种进步,使得运行 Linux 的一整类新型可扩展计算机成为可能。如今,全球各地都安装了运行 Linux 的 16 核、32 核甚至 64 核处理器系统,解决复杂问题并运行各种高端企业应用程序。

然而,对于高性能计算 (HPC) 社区的成员来说,即使是 64 核处理器的可扩展性也远远不够。HPC 用户通常需要利用数百甚至数千个处理器的计算能力来解决其基本问题,他们仍然要求更多。许多计算模型在资源需求和通信复杂性方面都超出了当今集群所能充分解决的范围。采用 Linux 的 HPC 用户不得不接受次优的集群性能。事实仍然是,当今可用的某些硬件解决方案的可扩展性远远超过当前标准 Linux 内核所支持的范围。仍然存在的问题是:基于 Linux 的系统是否能够扩展到足以满足这一苛刻用户群体的独特需求?

SGI 认为答案是肯定的,并在 2003 年 1 月推出了 Altix 3000 系列服务器和超级集群。Altix 系统具有非均匀内存访问 (NUMA) 架构,目前提供 64 核处理器的 Linux 扩展能力。全球已安装了 100 多台 Altix 系统,配置各异,其中许多部署为多节点系统,配置了 128 个以上的处理器。例如,荷兰科学研究组织 SARA 安装了 416 个处理器。凭借可以支持远远超出当前 64 核处理器限制的底层架构,Altix 客户已经询问他们如何帮助进一步扩展 Linux 也就不足为奇了。

为了响应客户的这种需求,SGI 正在与 Linux 社区和众多著名的 HPC 站点合作,致力于将 Linux 扩展到运行标准 2.4 Linux 内核的 128 个处理器。这项全球合作计划于 2003 年 8 月在旧金山 LinuxWorld 大会上宣布,参与者包括太平洋西北国家实验室、澳大利亚昆士兰大学、奥地利约翰内斯·开普勒大学计算中心、美国海军研究实验室 (NRL) 和 NASA 艾姆斯研究中心。该小组计划协助开发和测试 128 核处理器功能,并在 2003 年 11 月的年度超级计算贸易展上展示其目标方面的早期进展。下一个目标是在 2004 年初推出完全支持的产品。

此外,SuSE 也加入了这项工作,并正在评估是否将这项工作纳入公司未来发布的 SuSE Linux 企业服务器产品中。这一成就将再次打破 Linux 和开源软件的又一个玻璃天花板。

令人惊讶的可能是该小组认为将 Linux 扩展到 128 核、256 核甚至 512 核处理器并不会那么困难。这一结论的基础部分建立在 Altix 架构的灵活性以及 SGI 和用户在使用公司 IRIX 操作系统方面的经验之上,IRIX 操作系统运行在几乎相同的 Origin 硬件上。

例如,NASA 艾姆斯研究中心之前曾与 SGI 合作构建系统来模拟航天飞机并执行其他复杂研究。它目前安装了一个 1,024 核处理器的单系统映像 Origin。Linux 是否能够达到那种可扩展性水平尚不确定,但前景令人鼓舞。NRL 是第一个测试支持 128 核处理器可扩展性的代码更改的站点,对早期结果感到非常兴奋。与此同时,SGI 工程师基于强大的硬件基础和经验,相信 Linux 可以取得更大的成就,并对将操作系统扩展到远远超出 128 个处理器的模拟结果感到兴奋。

“显然,社区已经完成了该小组的大部分工作,使 Linux 非常强大。可扩展系统只是提供了一个放大镜,可以暴露操作系统中的小问题,这些小问题需要修复才能提供最佳性能”,SGI Linux 可扩展性首席工程师 Jack Steiner 说。

这项工作将回馈社区,最终,正在进行的可扩展性工作应该会使所有 Linux 用户受益,因为它将被纳入社区内核中。按照目前的测试速度,不到一年后,人们将会说,“你知道,Linux 只能可靠地扩展到几百个处理器。”

Jason Pettit 自 1998 年以来一直从事 Linux 系统工作。作为 Linux 和 Altix 3000 的产品经理,Jason 正在领导 SGI 冲锋陷阵,将 Linux 扩展到更高的高度。

加载 Disqus 评论