PGI 8.0+Tesla最快的个人超级计算机系统

时间:2009-02-26   来源:   网友评论:0   人气: 304 作者:

       PGI公司,专做基于FORTRAN语言的编译器,PGI 新版 GPU Fortran Compiler MP 架构编译指令,促使 Tesla 的运算性能在 Fortran 语言开发环境中发挥淋漓尽致。Tesla 的高效能计算令科学家及工程人员能以个人工作站的价格到超级计算机般的表现。PGI Fortran 语言编译软件的导入,弥补了 Tesla 硬件与科学应用软件的缺口。促使数值计算、纳米计算、流体动力学、生命科学、海洋科学、大气预报、分子生物及地球科学计算领域能立即展现 Tesla 的计算能量 ,挑战复杂的深度运算课题
A2.png 
      现在PGI把FORTRAN编译器变成了CUDA编译器,因为用CUDA编译器给他们带来更好的性能或更快的速度。FORTRAN,它实际上是一种编程语言,常用于高性能计算方面,在很多行业石油、天然气、勘探行业、医学行业
包括汽车需要建模的都会用到,客户也是很多的。比如在中国就有像中石油这样的公司包括一些汽车公司都会在他们集群上面使用FORTRAN语言。PGI现在通过CUDA完善了他的编译器,可以帮助他们的使用者最大限度的利用GPU提升并行运算能力,这在以前是根本不可能的
A1.jpg 


Portland Group公布支持 Linux、Mac OS X和Windows三大操作系统的PGI 8.0版高性能编译器及开发工具系列产品在所支持的三大平台上,PGI 8.0版Fortran和C编译器均全面支持最近发布的OpenMP 3.0多核并行编程标准新版软件还支持在Linux和MacOS平台上开发和调试OpenMPI应用程序,并完善了现有MPI编译程序在Linux和Windows集群上的功能目前,PGI 8.0版用户通过使用完全相同的PGI编译器、最新的OpenMP功能、可选的MPI软件和捆绑的OpenMP/MPI调试器和分析工具,可以在任何一款主流的台式机或服务器集群操作系统上开发部署多核和并行的应用程序作为具有重要意义的全新开发成果,PGI 8.0版标志着Portland Group开始进入加速计算领域,可以条件性支持并行计算任务,从x64主处理器自动分配到英伟达(NVIDIA)的具有CUDA功能的GPU处理器 .

“PGI的Unified Binary技术使开发人员能够利用AMD和英特尔的最新的CPU创新技术,同时把不同的x64 处理器视为一个单一平台,配合PGI 8.0版的新增功能,为HPC用户和大型多平台超级计算中心提供了最大的灵活性和自主性”Portland Group总监Douglas Miles表示

全新的性能分析工具
现有编译器及开发工具产品线已包含目前所有的最佳的HPC方法和多核编程技术除了延续现有产品线的成功之处外,PGI 8.0版编译器还增加了一个全新的功能:自动分析源代码,然后生成一个巨大的数据库,描述可行的或被抑制的性能优化方案,并提供源代码的修改意见,以便利用可行的优化措施随着8.0版编译器的推出,PGI利用通用编译器反馈格式(CCFF)使数据重组和访问数据的界面实现了标准化为了努力改进PGI、第三方和高性能计算产业的软件调试工具的可用性和互操作性,PGI正在公布CCFF标准,业内人士可以免费获得这项标准登录PGI网站http://www.pgroup.com/ccff可以获得更详细的CCFF的信息

在一个结构合适而紧凑的直观的图形用户界面(GUI)内,PGI的PGPROF®8.0性能分析工具可以显示CCFF数据以及用户源代码,同时还支持命令行界面程序员可以迅速简易地发现结构合适的代码段,以及性能有待改进的需要重组的代码段除能够识别占用计算机时间或系统资源最多的应用程序代码段外,PGPROF还为程序员提供具体且可行的源代码性能优化反馈建议通过识别以下内容,以每个线程和/或每个进程显示数据的方法能够简化性能调试:

•    单指令多数据流扩展(SSE)矢量回路,以及矢量化在非矢量回路受限制的原因
•    多核用自动并行化回路,和并行化在串行回路上受限的原因
•    OpenMP并行化的备选回路
•    回路的计算强度,把负荷分配给图形处理器(GPU)或加速器所需的备选回路
•    迭代数量极大或极小的回路,以及SSE和高速缓存分层架构性能的优化方法
•    数据预取,通过指令和pragmas命令优化数据预取的机会 

除这些详细的分析外,PGPROF还提供程序级总体分析,包括行内函数和例程的信息;每个文件是如何编译的信息;整个系统配置的信息;以及 Fortran、C和C++源代码的性能关键特性传统的性能调试工具只能报告和调试一个特殊类型的处理器或系统,或只能做并行化的调优任务,而PGI 8.0编译器及开发工具,能够在现代化的多核 x64 CPU或GPU加速器上,为程序员提供调试反馈,以及通过重组回路和算法来提高性能的建议 

“计算机处理并行化并不等于高性能,”Portland Group的编译器工程师Michael Wolfe表示,“问题的核心不是并行计算,而是系统性能,并行只不过是实现高性能的一个工具


 

文章评论