Opteron2214与Xeon5130评测

2008-09-20 02:57 来源: 作者:IT168 网友评论 0 条 浏览次数 256

服务器产品以Risc、x86、Epic三种架构区分,在近些年信息化快速纵深化推进与TCO预算占首要采购因素的大环境中,X86体系以高性价比优势快速抢占了95%以上的份额而成为了市场主流。这样一来,不可避免的,x86体系的一举一动都成为主流甚至整个服务器市场的焦点。我们都知道,整个x86服务器体系基本是IntelAMD的天下,顺理成章地,Intel与AMD成为主流服务器市场焦点的主角。

  有个老掉牙的词叫“商场如战场”,这主流市场的主角也不好当;又所谓“一山难容二虎”,企业追求的目标一向是以利益为上,本来两家企业的市场占有率之和已超过95%,想在这只有两个主角的主流服务器市场中,通过互不侵扰而获得更大的市场分额以取得更大的利益,这是不可能了。那企业的发展方向是什么?抢占竞争对手的市场!

  事实上,自AMD推出采用直连架构的Opteron以来,其与Intel前端总线架构的Xeon便碰撞不断,竞争从单核延续到了双核,长达两年的“真假双核”之争,更是将这出“戏剧”推向了高潮。在双核市场,Intel无心恋战,去年11月份发布了四核Xeon处理器,希望将市场快速的从双核拉动到四核。眼看AMD下半年就将推出代号“巴塞罗那”的四核处理器,新一轮竞争已进入热身赛。在整个服务器市场产品规划与新品推出的进度里,AMD好若缓流潜入,而Intel则似激浪猛进。

  从服务器用户的角度来看,双核市场的培育期不过2年时间,正在处于一个加速接纳这一“新鲜”事物的过程中。渠道市场里的散户开始追捧双核服务器;当初曾经徘徊的中小企业,已经基本认可高效而稳定的双核服务器产品;稳练而持重的大型机房,小批量更新采用双核服务器已有时日。

  从渠道的销售状况来看,Intel四核服务器产品与其双核服务器产品的价格差异依然较大,对于用户特别是价格敏感的中小企业用户来说,选购四核产品的意愿并不强烈。

  基于以上原因,我们IT168评测中心在这个较为特殊的时期组织了本次专题评测,希望通过对比AMD的Opteron2000系列(研发代号:Santa Rosa)与Intel的Xeon5100系列(研发代号:Woodcrest)产品,为用户选购双核服务器产品提供一些的参考。(IT168早在去年10月份曾推出Opteron 2210与Xeon 5120的对比评测,本次的对比将会引入更多“参赛选手”)。

  我们将从以下两系列产品中选择部分产品进行对比评测:

厂商系列 型号 主频 HTT/FSB L1(K) L2(M) TDP(W)
AMD Opteron2000 2210 1.80 1000Mhz 64+64 1*2 95
2212 2.00 1000Mhz 64+64 1*2 95
2214 2.20 1000Mhz 64+64 1*2 95
2216 2.40 1000Mhz 64+64 1*2 95
2218 2.60 1000Mhz 64+64 1*2 95
2220 2.80 1000Mhz 64+64 1*2 95
2222 3.00 1000Mhz 64+64 1*2 95
Intel Xeon5100 5110 1.60 1066Mhz 32+32 4(共享) 65
5120 1.86 1066Mhz 32+32 4(共享) 65
5130 2.00 1333Mhz 32+32 4(共享) 65
5140 2.33 1333Mhz 32+32 4(共享) 65
5150 2.66 1333Mhz 32+32 4(共享) 65
5160 3.00 1333Mhz 32+32 4(共享) 80

测试平台简介:

  Opteron2000系列与Xeon5100系列处理器测试平台:

系统支持项目 Opteron 2000系列 Xeon 5100系列
模块化/可扩展 支持 需要北桥
SMP 双路四核 双路四核
直接连接架构 支持 不支持
双核技术 支持 支持
32bit计算 支持  支持
64bit计算 AMD64 EM64T
HyperTransport技术 支持 不支持
内存控制器 整合于处理器 整合于北桥
硬件辅助虚拟化 AMD-V VT
HTT/FSB频率 1000MHz 1066MHz/1333MHz
最大处理器间带宽 8.0GB/s 8.5-10.66GB/s
内存类型 DDR2 400/533/667 FB-DIMM DDR2 533/667
最大双路内存带宽 21.2GB/s 21.3GB/s
L1 Cache [64K(Data)+64K(Instruction)]/Per core [32K(Data)+32K(Instruction)]/Per core
L2 Cache 1MB/core*2 4MB(share)
SIMD指令集 SSE/SSE2/SSE3 SSE/SSE2/SSE3/SSE4

  Opteron2214与Xeon5130平台对比

 
Opteron 2214平台 Xeon 5130平台
主板 ASUS KFN4-16 ASUS DSBF-D
芯片组 nVIDIA nForce Pro 2200, AMD Hammer Intel 5000P
处理器 AMD Opteron 2214*2 Intel Xeon 5130*2
主频 双核2.2GHz*2 双核2.0GHz*2
HTT/FSB 1000MHz 1333MHz
接口 Socket F Socket 771
L1 [64K(Data)+64K(Instruction)]/Per core [32K(Data)+32K(Instruction)]/Per core
L2 1MB*2(独立) 4MB(共享)
处理器设置 AMD Power Now! (Disable) Xdbit(Disable)EIST(Disable)C1 State(Disable)
内存 Kingston DDR2 533 Reg Ecc 512M*8 KingSton FB-DIMM 533 512M*8
磁盘 Seagate 73GB万转SCSI(型号ST373307LC) Seagate 73GB万转SCSI(型号ST373307LC)
磁盘控制器 LSI Logic PCI-X Ultra320 SCSI Host Adapter LSI Logic PCI-X Ultra320 SCSI Host Adapter
操作系统 Microsoft Windows Server2003SP1,5.02.3790,开启PAE Microsoft Windows Server2003SP1,5.02.3790,开启PAE
网卡 Broadcom NetXtreme Gigabit Ethernet (BCM5780整合GbE) Intel PRO/1000 EB Network Connection with I/O Acceleration

  本次测试了市面上基本对等的两款处理器。这里需要注意的一点是,两款处理器的架构、参数有所不同,Opteron 2214相对Xeon 5130在主频上要高出10%,在Intel FSB频率上,Xeon 5100系列从5130开始升级到1333Mhz,这么以来,则反过来要比AMD Opteron2000系列HTT频率高出33%。

  在Intel的Xeon 5130平台中,我们分别关闭了XDbit、EIST、C1 State功能,而在AMD的Opteron 2214平台中,我们关闭了“AMD Power Now!”功能。通过这些简单的优化设置,在提高两个平台性能的同时,保障两个平台的快速和顺畅运行。

  相关参数功能介绍:

  XDbit功能:Intel产品的内存保护功能,起到防止程序不正当运行的作用。关闭这项功能,在一些未能被系统正确识别的程序运行时,避免因报错而影响系统进程。

  EIST功能: Intel产品的处理器自动调频与调压功能,起到减少工作时耗电量与发热量的作用。关闭此项功能,可以保障平台在进行大批量数据处理的时候,一直保持高速度运行。

  C1 state: 当操作系统负载较小的情况下,会向处理器不断发送指令,通过降低处理器频率与电压将处理器能耗降低,如果与EIST功能进行配合使用,能够更好地控制系统空闲时间的能耗。关闭此项功能,可以让平台的处理状态时刻保持高速。

  AMD Power Now!: AMD产品的一种节电技术,依据处理器的负载情况实现自动调频调压,以达到省电效果。关闭此项功能,可以让平台的处理状态时刻保持高速。

测试方法研究:

  在本次测试过程中,以单机性能、网络应用和能耗为三个出发点,而如磁盘等相关的测试项目,因为处理器施加的影响几乎可以忽略不计,本次测试只做常规记录;能耗部分的测试本次也只做记录,各个平台的能耗测试结果,将在以后的时间进行集中对比。以下是我们所使用的常规测试项目:

  • SPECCPU2000 v1.2

  SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。

  SPEC CPU2000是SPEC组织推出的一套CPU子系统评估软件,它包括CINT2000和CFP2000两个子项目,前者用于测量和对比整数性能,而后者则用于测量和对比浮点性能。计算系统中的处理器、内存和编译器都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPEC CPU2000的影响非常的小。

  SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、DCC以及科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。

  我们在被测服务器中安装了Intel C++ 8.1 Compiler、Intel Fortran 8.1 Compiler这两款SPEC CPU2000必需的编译器,另外安装了Microsoft Visual Studio 2003.net提供必要的库文件。按照SPEC的要求我们根据自己的情况编辑了新的Config文件,可以满足Base测试。然后我们根据被测系统实际可同时处理的线程数量,设定用户数量,分别运行SPEC base和SPEC rate base测试的结果(其中SPEC base代表系统执行某个任务的速度,而SPEC base rate测试代表系统可以同时处理任务的能力)。

  • ScienceMark v2.0 Membench

  ScienceMark v2.0是一款用于测试系统特别是处理器在科学计算应用中的性能的软件,MemBenchmark是其中针对处理器缓存、系统内存而设计的功能模块,它可以测试系统内存带宽、L1 Cache延迟、L2 Cache延迟和系统内存延迟,另外还可以测试不同指令集的性能差异。

  • IOMeter 2004.7.30

  IOMeter是一款功能非常强大的IO测试软件,它除了可以在本机运行测试本机的IO(磁盘)性能之外,还提供了模拟网络应用的能力。在这次的测试中,我们仅仅让它在本机运行测试服务器的磁盘性能。为了全面测试被测服务器的IO性能,我们分别选择了不同的测试脚本。

  • Max_throughput(read):文件尺寸为64KB,100%读取操作,随机率为0%,用于检测磁盘系统的最大读取吞吐量

  • Max_IO(read):文件尺寸为512B,100%读取操作,随机率为0%,用于检测磁盘系统的最大读取操作IO处理能力

  • Max_throughput(write):文件尺寸为64KB,0%读取操作,随机率为0%,用于检测磁盘系统的最大写入吞吐量

  • Max_IO(write):文件尺寸为512B,0%读取操作,随机率为0%,用于检测磁盘系统的最大写入操作IO处理能力

  • SiSoftware.Sandra.Enterprise.v2007.5.10.98

  SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。今年该软件推出了2007版,该版本新增了4项基准测试,包括Power Management Efficiency、Memory Latency、Physical Disks和CD-ROM and DVD这四个项目。另外,它还对于原有的几个基准测试模块进行升级,比如在Arithmetic benchmarks中增加了对SSE3 & SSE4 SSE4的支持,在Multi-Media benchmark中增加了对于SSE4的支持,另外还升级了File System benchmark和Removable Storage benchmark两个子项目。对于新的硬件的支持当然也是该软件每次升级的重要内容之一。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台,这也是我们选择这款软件的原因之一。

  • WebBench v5.0

  WebBench是针对服务器作为Web Server时的性能进行测试,我们在被测服务器上安装了IIS6.0组件,以提供测试所需的Web服务。在测试中我们开启了网络实验室中的56台客户端,分别使用了WebBench 5.0内置的动态CGI以及静态页面脚本对服务器进行了测试。

  静态测试是由客户端读取预先放置在服务器Web Server下的Web页面(wbtree),这项测试主要考察的是服务器磁盘系统以及网络连接性能。我们使用了实验室中的56台客户端,配合Static_mt.tst多线程静态脚本测试向被测服务器发送请求。

  动态测试偏重于对服务器CPU子系统的性能测试,它对于Web服务器提供了足够的负载。我们将一个C语言编写的CGI源文件Simcigi.c编译为Simcgi.exe,并将其作为动态测试中的CGI脚本。在测试过程中,每台安装了WebBench客户端软件的PC,会在300秒的时间内持续向服务器发送CGI请求,而控制台会纪录并汇总服务器所响应CGI请求的数据。CGI测试的成绩高低,主要取决于服务器处理器子系统性能的优劣。处理器子系统包括CPU、内存以及内存控制器,CPU频率、缓存以及内存容量大小和内存带宽,都会影响该项成绩。

  • NetBench v7.03

  NetBench是针对文件服务器的性能测试软件,影响NetBench性能的主要是服务器的磁盘子系统,服务器磁盘控制器、条带大小、读写缓存、硬盘类型、组建磁盘阵列模式、内存容量、网络拓朴结构等都会对测试结果有明显的影响。我们在被测服务器上设立了文件服务器,NetBench通过网络实验室中60个客户端来模拟网络中的PC向文件服务器所发出的文件传输请求,文件服务器则将存储在磁盘上的文件数据发送给相应的客户端。在测试过程中,客户端会以每四台一组的步进依次增加并且向服务器发送文件传输请求,测试结束后控制台收集数据并绘制出服务器的数据传输变化曲线。

  • Benchmarkfactory 4.6

  大部分的服务器应用都同数据库有着密切的联系,因此我们今年开始着手在在服务器测试中加入对于数据库性能的测试。我们选择了Benchmark Factory 4.6软件和Microsoft SQL2000 SP4来测试不同的硬件平台在数据库应用中的表现。

  我们选择了BF内置的标准测试脚本AS3AP,这项测试可用于对于ANSI结构化查询语言(SQL)关系型数据库进行测试,它可用于测试DBMS(单用户微机数据库管理系统),也可用于测试高性能并行或者分布式数据库。

  • 系统功耗监测

  我们使用UNI-T UT71E智能数字万用表对于被测服务器系统的整体功耗进行了监测,利用随机附带的接口程序,我们可以记录被测服务器任意时间段内的功率变化。

 

处理性能测试数据对比:

Sisoftware.Sandra.Enterprise.w2007.5.10.98

平台 Opteron 2214 Xeon 5130
Processor Arithmetic
Dhrystone ALU(MIPS) 31977 36901
Whetstone iSSE3(MFLOPS) 27065 25316
Processor Multi-Media
Integer x8 iSSE4(it/s)   218962
Integer x4 Aemmx/aSSE(it/s) 83023  
Floating-Point x4 isse2(it/s) 90073 118633

处理器测试数据对比图

  Sisoftware Sandra Enterprise 2007在Arithmetic benchmarks中增加了对SSE3 & SSE4的支持,在Multi-Media benchmark中增加了对于SSE4的支持,AMD Opteron 2214处理器和Intel Xeon 5130处理器对于指令集的支持情况并不相同:

  AMD Opteron 2214:MMX(+)、3DNow!(+)、SSE、SSE2、SSE3、X86-64。

  Intel Xeon 5130:MMX、SSE、SSE2、SSE3、SSE4、EM64T。

  因此,除了Processor Multi-Media Integer测试之外,其它的三个测试项目均具有可比性。从上面的表格我们可以看到:

  Xeon 5120的Dhrystone ALU性能比Opteron 2214高出15%,Whetstone iSSE3性能却比Opteron 2214低上5%,Floating-Point x4 iSSE2性能比Opteron 2214高出33%。

  在Processor Multi-Media Integer测试中,Opteron2214只能调用MMX/SSE指令集,而Xeon 5130则可以调用更加强大的SSE4指令集,我们认为这是两款处理器在这项测试中存在差异的主要因素。

  综合数据运算、多媒体运算、浮点运算、整数运算、集成指令等单机处理性能指标来看,这两款主频相当的处理器性能以Xeon5130要略占先机。

缓存与内存测试对比1:

ScienceMark Membench

平台 Opteron 2214 Xeon5130
L1带宽 25349.66 55955
L2带宽 8004.17 16730
内存带宽(MB/s) 4811.24 3715.73
L1 Cache Latency(ns)
32 Bytes Stride 1.36 1.50
L2 Cache Latency(ns)
4 Bytes Stride 1.36 1.50
16 Bytes Stride 2.27 2.00
64 Bytes Stride 7.73 5.51
256 Bytes Stride 5.45 5.51
512 Bytes Stride 5.91 6.01
Memory Latency(ns)
4 Bytes Stride 1.82 1.50
16 Bytes Stride 6.36 6.01
64 Bytes Stride 25.45 23.56
256 Bytes Stride 64.54 73.19
512 Bytes Stride 66.82 84.71
Algorithm Bandwidth(MB/s)
Compiler 2214.75 2855.65
REP MOVSD 2168.51 2879.19
ALU Reg Copy 2219.56 2694.41
MMX Reg Copy 2342.33 2771.31
MMX Reg 3dNow 4323.21 -
MMX Reg SSE 4611.24 3715.73
SSE PAlign 3860.87 3612.19
SSE PAlign SSE 4799.24 3714.58
SSE2 PAlign 3861.00 3592.16
SSE2 PAlign SSE 4803.39 3705.21
MMX Block 4kb 4331.40 3024.50
MMX Block 16kb 4601.60 3289.65
SSE Block 4kb 4308.08 3002.86

  ScicenMark v2.0 Membench的测试结果显示, Xeon5130在缓存测试带宽环节要更好——这得归功于其4M大容量L2缓存;但是到了内存带宽测试的这一环节,Opteron 2214平台测试结果为4811.24 MB/s,而Xeon 5130平台仅为3715.73 MB/s。

  同样,Opteron 2214的L1缓存延迟较Xeon 5130要短,L2缓存延迟在各种大小不一的数据块运算中却是各有胜场,而且差距也不是太明显。这说明两款处理器还是在不同的应用中有更好的发挥。
在Algorithm Bandwidth测试中,不同算法应用下的带宽测试结果显示,Opteron 2214平台效果发挥得更见成效。

SiSoftware.Sandra.Enterprise.v2007.5.10.98

平台 Opteron 2214 Xeon 5130

Memory Bandwidth

RAM Int Buff iSSE2(MB/s) 11525 5566
RAM Float Buff iSSE2(MB/s) 11494 5574

Memory Latency

Random Access
1kB 3.0 3.0
4kB 3.0 3.0
16kB 3.0 3.0
64kB 3.0 14.1
256kB 17.3 15.7
1MB 22.1 16.1
4MB 101.6 27.5
16MB 103.6 119.8
64MB 109.3 136.6
Linear Access
1kB 3.0 3.0
4kB 3.0 3.0
16kB 3.0 3.0
64kB 3.0 12.3
256kB 17.1 12.3
1MB 17.3 12.3
4MB 28.1 13.9
16MB 28.1 24
64MB 28.1 24
Cache and Memory(MB/s)
2KB 89994 184015
4KB 86667 227696
8KB 85685 242227
16KB 89378 253158
32KB 90174 251228
64KB 87350 237891
128KB 76807 185520
256KB 69039 71940
512KB 53478 71359
1MB 43830 68525
4MB 27220 56955
16MB 9763 10683
64MB 9660 6607
256MB 9189 6240
1GB 7352 4992

  由于Opteron体系结构和Xeon体系结构不同,各类测试软件对于它们的支持也不尽相同。两平台的理论内存带宽基本一致,但Sisoft Sandra 2007的测试结果却显示,Opteron 2214平台的内存带宽是Xeon 5130平台的2倍多。

  同样的现象在Sisoftware2007项目的测试中出现,Opteron2214与Xeon5130在一二级缓存和内存子系统的不同,带来两者在不同运算模式和不同大小测试数据块的情况下,各有胜场。具体情况咱们可以在下一页通过图形的方式来更清楚的认识。

缓存与内存测试对比2:

  随机测试:

 

  线性测试:

 

注:以上两图中x轴代表测试数据块大小,而Y轴则代表延迟时间,单位为ns。

两平台不同的一二级缓存容量与内存控制器结构的影响,在图中清晰地显示出不同区间的高低转折点。

 

网络应用之Web服务器性能测试对比:

  在测试Web服务器的时候,我们选择了静态Web应用和动态CGI应用进行测试。

  在静态测试过程,服务器的I/O能力(比如磁盘吞吐量、网卡吞吐量)的高低是限制这项测试主要因素。动态测试时,吞吐量远没有达到被测服务器网卡的吞吐量上限,测试结果主要反映处理器、内存等部分的性能。

  如上图所示,双路Xeon 5130、4GFB-DIMM DDR2-533内存的平台,在服务器动态CGI请求处理能力上到达6953 Requests/s,而配置了双路Opteron 2214处理器、4GB DDR2-533的服务器动态CGI请求处理能力达到了更高的7358 Requests/s。Opteron 2214在此要领先Xeon 5130约5.8%。

  不过,我们从图表中也可以看到,两个平台的在处理不同数量的客户端动态请求时,当客户端数量达到14个客户端与32个客户端,两者处理请求的能力相当,而在14-32这个数量的客户端区间,Xeon 5130要稍占优势。

  总地来说,在Web服务处理性能测试环节,Xeon5130平台相对快速的处理性能拔高以及Opteron2214相对平稳而持续的性能提升同样适应不同的应用需求,在这个环节测试所得结果可说不分伯仲。

网络应用之数据库性能测试对比:

  我们在被测服务器上安装了Microsoft SQL 2000 SP4,按照测试要求建立了数据库。BF在测试之前会在数据库中生成9个表,其中包括4个500万行的表格,每行包括100字节的数据,因此每个表格容量大约是476MB,整个数据库容量为1.86GB。我们用60个客户端模拟1600个用户,并且以8个一组依次增加,在这个数据库中进行查询、添加、删除、修改等操作。在测试期间,数据的吞吐量很小,因此磁盘吞吐量和网络吞吐量都不会成为瓶颈。

  从以上的处理性能曲线我们可以看到,Opteron 2214和Xeon 5130在处理数据库操作请求时,与在Web服务器测试中所表现出来的性状有同样的规律:Opteron 2214的曲线比较平滑,峰值出现在1560个虚拟用户接入被测服务器的时候,达到了32862.77 Tps,在1560个虚拟用户之后,服务器的处理能力均维持在略低于33000 Tps的水平上;Xeon 5130在多于312少于832个虚拟用户的时候,其处理请求的性能相对迅猛,在这一区间内其性能相对要高于Opteron,但是当接入的虚拟用户的数量更多的时候,其性能只能维持在略低于32000 Tps左右。

  综上,这个项目的网络环境测试数据显示,Opteron2214虽然在更多用户接入的时候稍占优势,但如果算上其相对多出的200Mhz处理性能,其与Xeon5130同样是个难分上下的结局。

 

IT168评测中心观点:

  抛开软件控制与存储热点不谈,在目前市场中,双路Xeon 5130和双路Opteron 2214都可算是主流服务器配置里相对中等的处理水平,大家难免会对其投入更多的目光。

  通过以上的各项目测试,我们可以看到,由于L1、L2容量的不同,双方在单机环境内存、带宽、延迟等各测试区间的优势各不相同,但是在4M测试数据块大小区间外,各项测试数据都比较相近,并未出现太大的高低分歧。

  当然,双方在单机测试环境反映的各区间优势,相对其在服务器本身所处的网络核心位置没有太大意义,那么我们再来看看实际应用。

  由于牵扯到包括网络终端的互动和整机系统等的综合性能,所以要考虑的问题比较多。在本次进行的Web服务器与数据库服务器的测试中,我们可以通过两项目的综合处理性能趋势图看到,Opteron2214平台相对Xeon5130在一定程度上稍有优势,但如果同时考虑Opteron2214多出的200Mhz处理性能,双方总体性能仍然相当。

  另外,如果有朋友更加关注两系列产品的纵向比较,也可以在我们随后陆续推出的Woodcrest与Santa Rosa平台其他型号产品对比测试中得到相关数据资料;对于用户关注度较高的功耗,我们也会在完成各组性能测试之后,把各个产品平台服务器的整系统功耗测试部分集中推出,敬请随便关注IT168评测中心的动向。

 

上一篇:皓龙2218 Vs 至强..    下一篇:四核心Xeon Clove..

相关主题:

网友评论