四年专业论文网,提供各种免费论文及范文报告下载及代写论文服务,包括硕士论文,毕业论文,职称论文,英语论文

加入收藏 | 网站地图 | 在线留言
华东论文网网站LOGO 代写论文论文定制 发表论文发表论文 合作流程合作流程 付款方式付款方式 信用说明信用说明 刊物介绍刊物介绍
本站公告: 热烈庆祝华东论文网新版上线 [华东论文网 2008年6月16日] 欢迎光临华东论文网-专业的代写论文网 [华东论文网 2007年10月21日] 欢迎广大网友来投稿! [华东论文网 2006年11月10日] 为您提供高质量的代写论文服务 [华东论文网 2007年10月20日] 代写论文 论文定制 发表论文 发表论文 诚邀合作 诚邀合作
您现在的位置: 华东论文网 >> 免费论文 >> 计算机类 >> 计算机系统 >> 正文
热门文章
推荐文章
相关文章
没有相关论文
论文网栏目 毕业论文选题指导 集群系统计算性能测试研究 论文网栏目

集群系统计算性能测试研究

作者:佚名 文章来源:网络 点击数: 更新时间:2006-4-20
【摘   要】为了研究一个具体集群系统的计算性能,文章利用2个Benchmark工具(NAS parallel Benchmark,Linpack)测试一个拥有4个计算节点的集群系统的并行计算能力、高性能计算能力两个方面的性能。文章通过对比不同的系统软硬件配置和测试参数条件下的测试结果,对集群系统的总体计算效能做出了客观的评估,并对集群的优化提出了合理的建议。
【关键词】集群;并行计算能力测试;高性能计算能力测试
 一、引言
  集群(Cluster)系统是指利用高速通用或专用的网络将一组高性能工作站或PC机,根据需要按照一定的拓扑结构连接起来,在并行程序设计及集成开发环境支持下,实现高效并行处理的系统。一个基本的集群系统一般由操作系统、并行计算应用环境、中间件、计算节点、网络连接、空间环境等组成。近年以来,在高性能计算的领域中,集群计算机系统由于其具有兼容性好、可扩展性好、通用性强、开放标准、价格相对较低等一系列的优点,在与传统超级计算机的相比中,逐渐占据了上风,在天气预报计算、空气动力学模拟试验、生物分子模拟等应用领域有了广泛的应用。研究集群系统的性能,能够更好地利用系统资源,并能够优化扩展集群时取得更好的效果。
  论文针对一个由4台计算机组成的集群系统,从测试计算性能着手,对被测集群系统的实际应用性能做出客观科学的评估,对测试结果数据做出说明分析,并对集群的优化提出合理的建议。
  集群中最常用的两个并行计算环境是PVM和MPI,由于MPI的模块化好,效率高,方便移植等优点,使用更广泛。本次集群测试的实验采用的就是MPI应用环境。MPI(Message Passing Interface),消息传递接口,是基于消息传递编写并行程序的一种用户接口。
  测试内容为集群系统的计算性能,计算性能由NAS Parallel Benchmark测试并行计算能力和Linpack测试高性能计算能力组成。
  测试集群的机器配置如表1所示:
  表1

  因为性能测试的目的在于评估集群的性能指标,所以测试包括:测试集群的整体性能; 测试集群的可扩展性,即不同的计算节点数目或者进程总数对集群性能的影响;Benchmark软件不同的参数配置对测试结果的影响。
  二、并行计算能力测试
  (一)NAS Parallel Benchmark概述
  NAS Parallel Benchmark  (简称NPB) 可用于测试集群系统的并行计算能力。NPB来源于计算流体动力学(CFD)的代码,代表航空、物理学应用等高性能并行计算的全貌。它由8个子程序组成,这8个不同的子程序分别从不同的方面反映了CFD(流体动力学)计算的特点,包括:IS——整数排列,测试整数计算速度和通信能力;FT——快速傅里叶变换,检测长距离的通信;MG——多重网格求解,检测短距离和长距离的高度结构化通信;CG——共轭梯度(CG)方程求解,测试不规则的长距离通信;LU——上下对角线基准测试,测试细小块通信能力;SP——标量五角测试,检测计算和通信之间的平衡;BT——块状三角测试,同SP,用来检测计算和通信之间的平衡;EP——繁杂并行测试,检测按照特殊的方案产生一对高斯无序偏差。NPB 按照其测试的规模可以分为5个等级:S ,A,B,C,W(由小到大)。
  NPB测试结果中最重要的指标为MOP/S(millions of operations per second),每秒执行指令的百万次。它直接反映了所测试集群系统的并行计算能力的高低。MOP/S与CPU的时钟速率有关。另外,执行的时间也可作为参考量。
  (二)单节点性能测试比较
      单一节点上的并行计算性能,结果见表2所示:
表 2   (单位: MOP/S)
    
由表2可以看到,单个计算节点的性能高低主要受其CPU的时钟主频影响,grid55和grid54明显比grid52、grid49要好,因为它们CPU的主频明显较高。比较grid52与grid49这两台机器,它们的CPU主频相近,虽然grid49的内存仅有grid52的1/4,但测试指标相差不大,可见在单一节点的条件下内存对结果的影响不大(这也可能与测试的规模较小有关系)。而对比grid54和grid55,发现它们的测试数值比(第4列除以第1列)介于区间 [1.21,1.34] ,接近于它们CPU时钟的频率比 2.4G/1.8G=1.33,这也验证了上述的结论。
  (三)不同进程总数下的总体性能比较
  在四个计算节点上运行不同数量的进程总数(四个节点上执行程序的进程数相同),测试执行NPB程序的进程数目对总体并行计算性能的影响。测试结果见表3。
表3      (单位 MOP/S)
     从以上的表格和图示可以看到,总体并行计算性能在大体上是随着参加运算的进程数目增加而增加,也随着计算节点的增多而增多的。但当进程数较大时,每个节点上的同时执行的进程数过多,负担过多,造成总体性能的下降,但总的来说,Total performance是随进程数和计算节点数的增加而逐渐增大的。
  (四)不同进程数下的平均每个进程的并行计算性能比较
图1
      该测试主要是比较在不同进程总数下平均每个进程的并行计算性能,从图1中可以看到,每个进程的平均计算性能随着进程数目的增加而显著地减少。进程数目越多,平均每个进程上的并行计算性能的数值就越小。
      (五)不同的测试规模等级下的测试结果的比较
      表4列出了当NPROCS=4时,CLASS分别为S,A,B时NPB的结果对比。
表4 (单位 MOP/S)
       从上述的表格可以看到,虽然随着测试规模的增大,测试结果也有增大的趋势(例如 FT , SP ,BT) ,但是这并不代表CLASS的值越大测试结果就越大,对比SP CLASS A和B,发现相差不大,这说明集群系统已趋近最大性能。
  三、高性能计算能力测试
  (一) Linpack概述
  Linpack是一个用Fortran语言编写的线性代数软件包,主要用于求解线性方程组和线性最小平方问题。Linpack是测量高性能集群计算机浮点计算能力的重要工具。它的性能指标包括time 和Gflops(Gillions of floating-point operations per second)。HPL测试的参数比较多,其中最重要的是以下3个:
  NB,LU数据分解数据块大小,是指LU分解过程中所形成的数据小方块的大小。 NB的取值对HPL测试的结果比较重要,它的取值与集群系统的构造,网络连接方式,编译时用了哪个BLAS库,还有内存的大小这几个因素有关。通过测试本集群系统的NB取值120和80较为合适。
  NS,LU数据分解过程中形成的小数据方块的维数,它是定义被测系统内存的占用量。从并行计算的角度去看,并行计算总是尽可能多的在节点内计算,尽可能少的进行节点间的通信。NS的取值与集群系统的内存大小是有关系的。经测试被测集群系统NS取值应在[15000,16000]的区间上,即总内存占有率为40%左右。
      P*Q决定了进行HPL测试时处理器网格尺寸的大小,P代表水平方向上的处理器个数,Q代表垂直方向上的处理器个数,它代表了所有节点进程间的通信网格。经测试在相同的条件下,网格尺寸P*Q接近于正方形的,P略小于或者等于Q,其测试的结果较好。
  (二)可扩展性测试
表5   (NS=10000)  
      表5是集群在1个、2个和4个节点相同测试参数下的性能比较。1个节点时由于grid55机器的性能较好,而且没有网络通信负担,所以测试值较高。而2个节点又比不上4个节点的情况,因为虽然4个节点下通信开销大,但是由于参加并行计算的节点数量多,所以计算性能略好于2个节点下的情况。表6出了集群在4个节点下的HPL测试在不同参数组合下的一些测试结果。
表6
      四、测试总结
      从上面的测试结果来看,随着节点数和执行程序的进程数的增加,其总体的并行计算性能也有增加的趋势。增加计算节点数量是提高集群并行计算性能的一个可行的方法,但要考虑到性价比的问题。从测试的结果还可看到,进程数和计算节点数目增加,平均每个进程上的并行计算能力有下降的趋势。
  CPU时钟频率系数高的节点的并行计算能力较好,采用CPU性能较好的机器也是提高集群并行计算能力的方法。而相对而言,内存对测试结果的影响不大。
      集群NPB并行计算能力测试的最优数据如表7所示:

      利用Linpack评估集群系统的高性能计算能力时需要对测试参数进行合理的配置在Linpack众多的测试参数中,NS,NB,P*Q最为重要。
      本集群系统的测试参数NB取120或80较好,NS取值在[15000,16000]较好,P*Q尽量取接近正方形的,且P略小于或等于Q,测试结果准确度较高。
      计算节点的增多可以提高高性能计算能力,但节点数目的增大也有可能会导致通信开销增大而使性能受影响。
      表8是在集群Linpack测试的最优结果值。
      通过分析测试数据,可以从以下几个方面进一步提高该集群系统的效能:采用CPU时钟频率更高,一级二级缓存更大的机器作为计算节点;改善节点之间的网络连接,采用更好更快的网络连接;增加计算节点的数量;增加集群内存总量。
 
【参考文献】
      [1]车静光.微机集群组建、优化和管理[M].北京:机械工业出版社.
      [2]都志辉.高性能计算之并行编程技术—— MPI并行程序设计[M].北京:清华大学出版社.

论文录入:华东论文网    责任编辑:华东论文网 
  • 上一篇论文: AT91RM9200处理器的内部启动机制

  • 下一篇论文: 没有了
  • 【字体: 】【发表评论】【告诉好友】【打印此文】【关闭窗口
    联系我们 | 版权申明 | 友情链接 | 关于论文网 | 网站地图 | 银行汇款说明 | 加盟笔杆子说明

    客服电话:13886096221(全天) QQ在线客服:论文代写在线QQ50403530 联系邮箱:hdlww@hdlww.com
    CopyRight (C)2004-2008 Www.hdlww.Com All Rights Reserved.. 浙ICP备05017412号
    所有论文资料均源于网上的共享资源及期刊共享,请特别注意勿做其他非法用途
    如有侵犯您的版权或其他有损您利益的行为,请联系指出,华东论文网会立即进行改正或删除有关内容
    本站关键词:

    论文网 硕士论文 毕业论文 职称论文 英语论文 代写论文