终极未来 Linux Box

作者:Nicholas Petreley

我们拿到了 AMD rev. F 处理器(FX-60 或 X2-5000+),以及为此处理器构建的 ASUS M2N32-SLI Deluxe 主板,我们确信这指明了终极未来 Linux Box 的方向。

电影 This Is Spinal Tap 讲述的是一个虚构的重金属乐队,成员们都不太聪明。在一个场景中,一位吉他手提到,如果他将吉他的音量调到 10,并将放大器的音量调到 10,那就是最大声了。没有地方可以再调高了。然后他吹嘘自己有一个放大器,上面的旋钮编号高达 11。主持人罗伯·雷纳问他是否不能直接买一个音量 10 就更响的放大器。吉他手困惑了一会儿,然后说:“但这个可以调到 11。”

CPU 已经接近达到 10 的程度,没有地方可以再提升了。AMD 和英特尔在一段时间内一直在与摩尔定律抗衡。他们只能从处理器中挤出这么多的千兆赫兹。双核处理器应运而生。在历史的这个阶段,通过添加第二个核心来提高性能比试图不断提高 GHz 评级更容易(尽管 AMD 和英特尔也在这样做)。

这解决了处理器的技术瓶颈,但没有解决下一个性能瓶颈:如何以最有效的方式让处理器与 RAM 通信。到目前为止,我们已经看到 AMD 和英特尔尝试通过提高前端总线频率并支持更新、更快的 RAM 类型和 RAM 配置来解决这个瓶颈。

快进到昨天(相对而言)。英特尔支持 DDR2 RAM,但 AMD 最多只能做到双通道模式的 DDR——因此需要新的基于 AM2 插槽的 AMD64 处理器。旧的 socket 939 系列 AMD64 双核处理器和未来的新 socket AM2 处理器之间的区别因素是,新处理器包括用于 DDR2 RAM 的片上内存控制器。否则,这两个处理器本质上是相同的。

不成功,便成仁

关键词是“片上”。这现在是 AMD 和英特尔处理器之间的区别因素。目前,英特尔必须使用板载内存控制器才能访问 DDR2 RAM。虽然理论和实践并不总是匹配,但从理论上讲,这在长远来看给了 AMD 比英特尔更大的优势。

为什么?关于内存访问的最大性能瓶颈之一是延迟。延迟是处理器在获得其请求的信息之前必须等待的时间。AMD 通过将内存控制器放在 CPU 本身上而不是依赖主板上的内存控制器来减少延迟——理论上是这样。事实上,所有 AMD64 处理器都包括片上内存控制器。socket 939 处理器和 socket AM2 处理器之间的区别在于,基于 AM2 的处理器拥有未来,因为它们支持 DDR2。

DDR 最终会走到尽头。今天,DDR2 几乎没有比 DDR 更好的改进,但 DDR2 一直在改进。事实上,Corsair 在 AMD 发布 socket AM2 处理器大约同一时间发布了新的 DDR2 内存模块。时机并非巧合。如果没有更好的 DDR2 模块,您就看不到 socket AM2 处理器的任何优势。

就目前而言,即使使用更好的 DDR2 模块,您也看不到太多优势。但那是因为我们仍处于 DDR2 性能的早期阶段。直到最近,DDR2 性能一直很差。最新的 DDR 模块比几个月前能买到的模块好很多。并且 DDR2 应该随着时间的推移稳步提高。

未来在哪里?

问题将是,哪种处理器最能利用 DDR2 性能的提升?AMD 正准备凭借其片上内存控制器赢得这场战斗。只有时间会证明一切,但我会将赌注押在 AMD 上。将内存控制器放在片上而不是像英特尔处理器目前的工作方式那样,通过依赖主板上的内存控制器来增加延迟,这显然更有意义。

您现在可能已经看过无数 socket AM2 处理器的基准测试,其中大多数显示与现有处理器相比几乎没有改进。我们尝试了相同类型的比较,发现 X2-5000+ 双核 socket AM2 处理器轻松击败了我们的 AMD64 4400+ Athlon x2。这并不太令人惊讶,因为处理速度有相当大的提高。但是,我们没有一个可以与新系统进行公平比较的系统。

这里有个诀窍。AMD 声称,即使使用 DDR2 内存,速度也不是问题,延迟才是问题。如果您熟悉处理器如何访问内存,您就会知道这在理论上是完全可信的说法。但这在实践中是否奏效呢?

我们想看看延迟是否真的像 AMD 声称和理性所指示的那样影响性能。AMD 在早期向评测人员发送了一些样品产品,当时 DDR2 模块仍然存在高延迟问题。当 AMD 最终发布 socket AM2 处理器时,它声称我们会看到比早期样品高约 1% 的性能提升。我们没有早期样品,因此我们通过更改 BIOS 中的延迟设置,将 DDR2 以前的延迟能力与当前的延迟能力进行了比较。您可以在图 1 中看到使用更快设置 (4,4,4,12) 的性能。有关旧延迟设置 (5,5,5,15) 的基准测试结果,请参见图 2。

The Ultimate Future Linux Box

图 1. AM2 的内存和缓存性能基准测试结果

The Ultimate Future Linux Box

图 2. 延迟设置为 5,5,5,15 时的内存和缓存性能

您看到区别了吗?也许没有。试着眯起眼睛,稍微转动一下头再看一遍。如果您仔细观察,您会看到一些性能差异。但是我们可以省去您解读数字的麻烦。

首先,为了好玩,我们想向您展示这些基准测试与 AMD64 4400+ 上相同基准测试之间的巨大差异(见图 3)。

The Ultimate Future Linux Box

图 3. AMD 4400+ Athlon x2 在 4GB 双通道 DDR400 RAM 上的性能

现在,回到延迟问题。AM2 上两种延迟设置之间确实存在性能差异,但诚然,从此处显示的图表中很难看出。因此,我们运行了一些基于 Windows 的图形基准测试,以 выяснить 我们是否可以更清楚地看到差异。我们从 AMD 自己的 nbench 开始。我们在 ASUS M2N32-SLI Deluxe 上运行了 nbench,配备了 5000+ 处理器,并配备了两块 eVGA 7900GT NVIDIA 显卡,采用 SLI 模式,抗锯齿和各向异性过滤设置设置为应用程序控制。表 1 显示了不同延迟时序的 nbench 结果。

表 1. 比较不同延迟设置下的 nbench

配置:AM2 SLI-AC 5,5,5,15 
CPU 整体性能 2844
3-D 整体性能 3992
整体性能 3418
配置 AM2 SLI-AC 4,4,4,12 
CPU 整体性能 2857
3-D 整体性能 4047
整体性能 3450

我们将为您进行数学计算。性能差异约为 1%,与 AMD 的预测完全一致。为了好玩,我们将图形设置调到最佳的抗锯齿和各向异性过滤。虽然由于额外的工作量,整体性能有所下降,但两种延迟设置之间的性能差异再次约为 1%。

下一个基准测试比较是苹果与橙子,但它确实表明,与 AMD64 4400+ 相比,改进足以让我们对新系统垂涎三尺,无论它从哪里获得动力。见表 2。即使图形设置完全最大化以获得最佳质量,AM2 系统的性能也比 4400+ 系统提高了 15%,尽管 4400+ 系统安装的 RAM 是其四倍。

表 2. 5000+ AM2 让 4400+ 939 相形见绌。

AM2 SLI-MAX 
CPU 整体性能 2855
3-D 整体性能 4003
整体性能 3429
AMD64 4400+ SLI-MAX 
CPU 整体性能 2480
3-D 整体性能 3459
整体性能 2970

所有这些数字的问题在于,它们无法反映出观看新系统渲染图形是多么令人愉悦。来自未发布游戏(未发布是因为当前系统无法处理它们)的片段在 socket AM2 系统上像电影一样运行,即使所有图形设置都设置为最大值。它们在 4400+ 系统上运行得不太像幻灯片,但即使将所有图形设置都调到最低,卡顿感也极其烦人。

更重要的是,延迟设置更改带来的 1% 性能差异在纸面上看起来可能不算什么,但当您运行 3-D 图形基准测试时,通常很容易看到改进。这是因为 3-D 场景在每秒 30 帧或更高帧率下看起来最好。当帧率徘徊在每秒 25 帧或更低帧率和 30 多帧之间时,您真的会注意到 1% 的性能差异。即使场景的渲染稍微卡顿一点,也可能会非常恼人。

当我们使用不同的延迟设置运行基于 Windows 的 AquaMark3 基准测试时,我们看到了接近 2% 的性能提升(表 3)。这个特定的基准测试不会降到临界帧率,因此您不会像在其他基准测试中那样注意到性能差异。但是您可以从图中看到,帧率确实会随着不同的延迟设置而变化。

表 3. AquaMark3 结果——当更改内存延迟时,您会看到 2-6 帧/秒的改进。

AM2 5000+,AM2 SLI,延迟设置 5,5,5,15 
显示宽度 1024
显示高度 768
显示深度 32
抗锯齿模式 0
抗锯齿质量 0
各向异性过滤 4
细节级别 4
平均帧率 97.668488
最低帧率 68.000000
最高帧率 156.000000
平均帧率渲染 182.529037
平均帧率模拟 209.958633
平均每秒三角形数 29,401,354
最低每秒三角形数 3,624,963
最高每秒三角形数 117,690,170
Aquamark 分数渲染 18252
CPU:Aquamark 分数模拟10498
Aquamark 分数 97668
AM2 SLI,延迟设置 4,4,4,12 
显示宽度 1024
显示高度 768
显示深度 32
抗锯齿模式 0
抗锯齿质量 0
各向异性过滤 4
细节级别 4
平均帧率 99.716568
最低帧率 70.000000
最高帧率 158.000000
平均帧率渲染 185.784760
平均帧率模拟 215.265106
平均每秒三角形数 30,017,894
最低每秒三角形数 3,775,542
最高每秒三角形数 122,671,018
Aquamark 分数渲染 18579
CPU:Aquamark 分数模拟 10764
Aquamark 分数 99716
结论

当我们收到 AMD rev. F 处理器(FX-60 或 X2-5000+)以及为此处理器构建的 ASUS M2N32-SLI Deluxe 主板时,我们垂涎三尺。当然,我们听说这只是对现有 AMD64 Socket 939 处理器及其主板的渐进式改进。事实上,大多数人认为根本没有改进。事实证明,许多基准测试表明性能提升微乎其微。

但是,我们认为大多数评测都只见树木不见森林。基于 AM2 插槽的处理器和主板并不是为了在 今天 提供指数级的性能提升。而是为了未来指数级的性能提升奠定基础。我们无法告诉您今天投资 socket-AM2 主板和处理器是否值得。您承担的风险主要取决于内存制造商能够多快地改进 DDR2 以及您的主板是否支持改进的 DDR2 模块。

然而,从长远来看,DDR2 肯定会改进,AMD 无疑会推出需要 DDR2 和更低延迟的四核处理器,以便利用四核的优势。因此,尽管今天投资 socket AM2 系统可能显得轻率,但我们预测,好处变得无可争议的时刻即将到来。英特尔完全有可能从其设计帽子中变出兔子,超越 AMD 的方法,但我们目前还没有看到这种情况发生。这就是为什么我们将 socket AM2 系统视为未来的终极 Linux Box。

Nicholas Petreley 是 Linux Journal 的主编,曾任程序员、教师、分析师和顾问,从事 Linux 工作和写作已超过十年。

加载 Disqus 评论