浮点运算谁最强,FireStream 9250、GTX280、CSX700对比分析(2)

时间:2009-05-31   来源:   网友评论:0   人气: 1947 作者:


第02页:Tesla S1070发布 单精度浮点能力超4TFlops可以看出,G200的浮点处理能力还是很强的,只要稍微超频,就可以使其突破1TFlops大关,索泰推出超频版GTX 280的意义也就在此。虽然公版GTX 280没有突破1TFlops浮点运算能力,但是NVIDIA推出的另一款科学计算专用产品——Tesla S1070却达到了。

 

4核Tesla显存达16G浮点处理能力超4T

Tesla S1070

Tesla S1070是一个整套的科学计算解决方案,简单点说就是一台高性能的工作站。Tesla S1070里拥有4颗G200 GPU,每颗GPU的Shader频率达到了1500MHz,根据“流处理器数量×每个流处理器同时执行的命令数×流处理器频率=浮点处理能力”的公式来计算,拥有240个流处理器且每个流处理器同时能执行3条指令的G200 GPU,在频率达到1500MHz的情况下,单精度浮点能力可以达到1080GFlops,超过了1TFlops,4颗GPU同时运算时单精度浮点能力可超过4TFlops。

4核Tesla显存达16G浮点处理能力超4T

从外观上看酷似一台1U服务器

那么NVIDIA为什么在公版的GTX 280上就没能突破1TFlops,而在Tesla S1070则可实现呢?实际上理解起来很简单,Tesla S1070是在一个整套的科学计算解决方案,有一个独立的机箱,外观上看实际上就是一个1U的服务器,只要在机箱内空间允许的情况下,NVIDIA可以随意使用散热设备,况且这样的产品定价肯定不低,即使用全球最顶级的散热设备,NVIDIA也能有可观的利润。,所以说,NVIDIA在这套设备上是根本不怕发热量以及功耗的。

4核Tesla显存达16G浮点处理能力超4T

Tesla C1060

当然,NVIDIA还推出了另一款Tesla系列科学计算卡,型号为Tesla C1060,由于这个是像GTX 280一样以独立卡的形式出现,所以情况就和GTX 280很相似了,为了保证发热量、功耗以及成本,Shader频率没有突破1400MHz,浮点运算能力自然也就没有突破1TFlops。


 

文章评论