优化高性能计算(HPC)的性能

2007-12-10 02:45 来源: 作者: 网友评论 0 条 浏览次数 101
更为复杂的工作负载:SPEC_CPU2000

让我们来关注一下更为复杂的工作负载,完成时间的性能计算在初始参数上仍然是直线。由此可以看出内存时间(Tmemory)还需要较大的高速缓存存储器进行缓冲存储。这个分析让我们意识到M(MBcache)的重要性。SPEC CPU2000 benchmark suite无疑是个不错的选择。这一点已经为大家所熟知。在这张图示上我们将基线编译器标记(-O2)与每一项工作负载相结合。复合工作负载的完成时间刚好是单个组件工作负载的完成时间(约等于25)。

为了测试高速缓存存储器体积对性能的影响程度,我们用"Gallatin"处理器系统来作为测试平台。这个处理器是单核Netburst体系机构的CPU,512KB L2和2MB L3高速缓存存储器。图示6向我们展示的是在处理器时钟周期变化时复合工作负载的完成时间。

深蓝色的数据点和线性图符合了激活的2MB L3高速缓存存储器的结构。淡蓝色的数据点和线性图则反映了不起作用的L3高速缓存存储器的结构情况,非常有效的把高速缓存存储器的体积精简到了512KB。这两个线性图都是平行线。斜面值是一样的,几乎没什么差别。更有趣的是我们能看到,当高速缓存存储器的体积从512KB变成2MB时,测试值的变化。内存访问和Tmemory完成的时间总计减少了1.75x。这个结论等同于增大了总线(bus)和内存频率1.75x。对于复合工作负载来说,高速缓存存储器的体积非常重要。

综述

现在对我们的分析做一个综述。在定性的基础上我们可以轻易的对影响高性能计算性能的因素进行罗列,比如更快的处理器,更大容量的内存,磁盘,网络等等。如果是在量化的基础上来回答这个问题,答案则有较大的不同。尤其是对于那些预算有限的用户而言,这一点是比较重要的。一台速度更快的处理器会花费更多的费用吗?在我的集群上需要PCIExpress Gen2时钟缓冲器吗?我应该购买更快的内存来获取每个计算节点上更多的内存容量吗?我如何能为用户提供更大的计算机功率(在相同的年度预算前提下)?

我们试图向大家阐明使用一个相对简单的计算节点运用模型就能很好的解释这些疑问。对于既定的工作量和计算节点,这个模型只需要简单的工具(那就是电子数据表)就能轻易的进行验证。使用这个模型还能够帮助我们解决如何选购,容量规划方面的疑问。那么回到我们最初的问题上来"如何优化高性能计算的性能?",答案是一切都取决于工作负载。

 

 

 

 

[上一页1  2  3  4  5  6 
上一篇:高性能计算Linux..    下一篇:HPC的未来 从超..

相关主题:

网友评论