平码五不中公式规律
  • / 8
  • 下载费用:30 金币  

多核分布式计算环境下结构分析的高效通信方法.pdf

关 键 ?#21097;?/dt>
多核 分布式 计算 环境 结构 分析 高效 通信 方法
  专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
摘要
申请专利号:

CN201410114865.0

申请日:

2014.03.25

公开号:

CN103914428A

公开日:

2014.07.09

当前法律状态:

驳回

有效性:

无权

法?#19978;?#24773;: 发明专利申请公布后的驳回IPC(主分类):G06F 15/163申请公布日:20140709|||实质审查的生效IPC(主分类):G06F 15/163申请日:20140325|||公开
IPC分类号: G06F15/163 主分类号: G06F15/163
申请人: 上海交通大学
发明人: 苗新强; 金先龙; 楼云锋; 胡豹
地址: 200240 上海市闵行区东川路800号
优先权:
专利代理机构: 上海汉声知识产权代理有限公司 31236 代理人: 郭国中
PDF完整版下载: PDF下载
法律状态
申请(专利)号:

CN201410114865.0

授权公告号:

||||||

法律状态公告日:

2017.10.24|||2014.08.06|||2014.07.09

法律状态类型:

发明专利申请公布后的驳回|||实质审查的生效|||公开

摘要

本发明提供一种多核分布式计算环境下结构分析的高效通信方法,包括四个步骤?#28023;?)通过两级分区策略生成并行计算所需的数据文件;(2)同一节点机内的不同进程间相互通信,利用两次缩聚策略对求解问题的规模进行大幅?#20154;?#20943;;(3)不同节点机的局部主进程间相互通信,利用分布式迭代求解器求解系统界面方程,再回代1级子区域内部自由度;(4)各2级子区域进程从所在节点机的局部主进程接收1级子区域计算结果,然后提取自身边界自由度值,再回代内部自由度并计算应变、应力。若时间步结束则终止,否则重新从(2)开始。本发明在大规模并行结构分析的过程中实现?#31169;?#28857;机内通信和节点机间通信的分层处理,有效提高了通信效率。

权利要求书

权利要求书
1.  一种多核分布式计算环境下结构分析的高效通信方法,其特征在于,包括如下步骤:
第一步,通过两级分区策略生成并行计算所需的数据文件;
第二步,同一节点机内的不同进程间相互通信,利用两次缩聚策略对求解问题的规模进行大幅?#20154;?#20943;;
第三步,不同节点机的局部主进程间相互通信,利用分布式迭代求解器求解系统界面方程,再回代1级子区域内部自由度;
第四步,各2级子区域进程从所在节点机的局部主进程接收1级子区域计算结果,然后提取自身边界自由度值,再回代内部自由度并计算应变、应力;若时间步结束则终止,否则重新从第二步开始执行。

2.  根据权利要求1所述的多核分布式计算环境下结构分析的高效通信方法,其特征在于,所述第一步中,所述两级分区策略通过两级剖分实现分区过程:结构有限元网格首先被并行剖分为M个1级子区域,然后每个1级子区域再进一步被独立地剖分为N个2级子区域;为与多核分布式计算环境相适应,M等于并行计算每次启动的节点机总数,N等于单个节点机内处理器总核数。

3.  根据权利要求1所述的多核分布式计算环境下结构分析的高效通信方法,其特征在于,所述第一步中,所述数据文件是指通过两级分区策略生成的各1级子区域和2级子区域的分区信息文件,每个文件包含该子区域的单元、节点、载荷、边界条件和相邻分区信息。

4.  根据权利要求1所述的多核分布式计算环境下结构分析的高效通信方法,其特征在于,所述第二步中,所述两次缩聚策略通过依次在2级子区域和1级子区域上应用舒尔补方法实现缩聚过程:首先同时独立形成各2级子区域平衡方程,并经过缩聚消去各2级子区域内部自由度;然后通过节点机内通信将同一节点机内所有2级子区域界面方程组集以形?#19978;?#24212;1级子区域平衡方程;再利用节点机内通信进行并行缩聚消去各1级子区域内部自由度,得到各1级子区域仅与边界自由度相关的界面方程。

5.  根据权利要求1所述的多核分布式计算环境下结构分析的高效通信方法,其特征在于,所述第三步中,所述局部主进程是指在各节点机内指定的一个具有汇总和协调处理功能的进程,由该具有汇总和协调处理功能的进程统一负责该节点机内1级子区域 的操作,包括平衡方程的形成、并行缩聚数据的分发、缩聚结果的汇总、系统界面方程的求解以及内部自由度的回代。

6.  根据权利要求1所述的多核分布式计算环境下结构分析的高效通信方法,其特征在于,所述第三步中,所述分布式迭代求解器求解时,各子区域缩聚刚度矩阵和缩聚载?#19978;?#37327;仍分布式存储在各个节点机上,中间计算结果也以矩阵和向量积的形式分布式存储;局部通信只存在于具有相邻子区域关系的不同节点机间,只有点积操作和整体迭代误差的计算需要节点机间全局通信。

7.  根据权利要求1所述的多核分布式计算环境下结构分析的高效通信方法,其特征在于,所述第四步中,所述2级子区域进程是指负责处理每个2级子区域的进程;在并行计算时每个1级子区域由所在节点机的局部主进程统一负责处理,同时派生于该1级子区域的所有2级子区域分别被分配给同一节点机内的不同进程单独处理。

说明书

说明书多核分布式计算环境下结构分析的高效通信方法
技术领域
本发明涉及一种并行计算通信方法,具体是一种多核分布式计算环境下结构分析的高效通信方法。
背景技术
随着多核计算革命的兴起,每个芯片上能够集成的处理器核越来越多。这些核之间的通信延迟?#23545;?#20302;于传统的集?#28023;?#22240;此不管是桌面计算机还是高性能计算机都逐步采用多核的处理器。在由多核处理器构建的分布式计算平台中,我们不仅要考虑不同节点间的通信,而?#19968;?#35201;考虑同一节点内不同处理核间的通信。通信延迟是制约多核分布式计算环境下有限元数值仿真可扩展性和性能提高的主要因素之一。由于多核分布式计算平台一般由多核、多处理器和多节点的层次?#28304;?#29702;元素组成,这些组成元素之间的通信延迟从纳秒到微秒不等,使得多核分布式环境下的通信开销也具有层次性的特点。在同一节点内不同处理器核之间的关系是紧密耦合的,这些核心间通过共享高速缓存或片上网络互联。而各计算节点间通过高性能互联网络联接,所以各计算节点之间是松散耦合的关系。因此,多核分布式环境下不同节点间的通信开销比同一节点内处理器核间的通信开销要大很多。为提高多核分布式环境下大规模并行结构分析的效率,?#33455;?#21644;开发能够解决当前环境下通信延迟差异和层次性组织结构带来的性能问题的高效的通信方法是当务之急。
经对现有技术文献的检索发现:郭永辉等在固体力学学报,2013,33:262-265上发表文章“爆炸作用下花岗岩中应力波传播的并行计算?#20445;?#35813;文基于区域分解法通过动态负载均衡技术来提高并行计算的效率。然而采用该方法进行大规模并行结构分析时,系统并行效率并不高。这是由于对大规模问题而言,首先负载均衡本身耗时较长,不宜频繁地使用;其次,随着子区域数目的增多界面方程的规模和条件数?#24067;本?#22686;加导致其在求解时需要更多的迭代次数才能收敛,由此大幅度增加了系统总的通信量;此外,该方法并未考虑多核分布式环境的特点,它在求解界面方程时所有子区域进程既要参与局部通信又要参与全局通信。由于节点内与节点间通信延迟的差异,这就造成进程间通信和同步开销会随子区域的增多而明显增加很多。 发明内容
本发明针对现有技术的不足,提出一种多核分布式计算环境下结构分析的高效通信方法。该方法充分考虑了多核分布式计算平台下通信延迟的非均匀性和层次性特点,在大规模并行结构分析的过程中实现?#31169;?#28857;机内通信和节点机间通信的分层处理,从而有效提高了通信效率。
根据本发明提供的一种多核分布式计算环境下结构分析的高效通信方法,包括如下步骤:
第一步,通过两级分区策略生成并行计算所需的数据文件;
第二步,同一节点机内的不同进程间相互通信,利用两次缩聚策略对求解问题的规模进行大幅?#20154;?#20943;;
第三步,不同节点机的局部主进程间相互通信,利用分布式迭代求解器求解系统界面方程,再回代1级子区域内部自由度;
第四步,各2级子区域进程从所在节点机的局部主进程接收1级子区域计算结果,然后提取自身边界自由度值,再回代内部自由度并计算应变、应力;若时间步结束则终止,否则重新从第二步开始执行。
优选地,所述第一步中,所述两级分区策略通过两级剖分实现分区过程:结构有限元网格首先被并行剖分为M个1级子区域,然后每个1级子区域再进一步被独立地剖分为N个2级子区域;为与多核分布式计算环境相适应,M等于并行计算每次启动的节点机总数,N等于单个节点机内处理器总核数。
优选地,所述第一步中,所述数据文件是指通过两级分区策略生成的各1级子区域和2级子区域的分区信息文件,每个文件包含该子区域的单元、节点、载荷、边界条件和相邻分区信息。
优选地,所述第二步中,所述两次缩聚策略通过依次在2级子区域和1级子区域上应用舒尔补方法实现缩聚过程:首先同时独立形成各2级子区域平衡方程,并经过缩聚消去各2级子区域内部自由度;然后通过节点机内通信将同一节点机内所有2级子区域界面方程组集以形?#19978;?#24212;1级子区域平衡方程;再利用节点机内通信进行并行缩聚消去各1级子区域内部自由度,得到各1级子区域仅与边界自由度相关的界面方程。
优选地,所述第三步中,所述局部主进程是指在各节点机内指定的一个具有汇总和协调处理功能的进程,由该具有汇总和协调处理功能的进程统一负责该节点机 内1级子区域的操作,包括平衡方程的形成、并行缩聚数据的分发、缩聚结果的汇总、系统界面方程的求解以及内部自由度的回代。
优选地,所述第三步中,所述分布式迭代求解器求解时不需形?#19978;?#32479;总体界面方程,各子区域缩聚刚度矩阵和缩聚载?#19978;?#37327;仍分布式存储在各个节点机上,中间计算结果也以矩阵和向量积的形式分布式存储;局部通信只存在于具有相邻子区域关系的不同节点机间,只有少量的点积操作和整体迭代误差的计算需要节点机间全局通信。
优选地,所述第四步中,所述2级子区域进程是指负责处理每个2级子区域的进程;在并行计算时每个1级子区域由所在节点机的局部主进程统一负责处理,同时派生于该1级子区域的所有2级子区域分别被分配给同一节点机内的不同进程单独处理。
与现有技术相比,本发明具有如下的有益效果:
(1)通过对节点机内通信和节点机间通信的分层处理,有效减少?#31169;?#31243;间的通信和同步开销,克服了多核分布式环境下通信延迟差异造成的计算性能下降。
(2)在大规模并行结构分析的过程中大量局部通信被限制在通信开销很小的各节点机内,同时又大幅度削减了参与开销较大的节点间通信的进程数,从而有效提高了通信效率。
(3)相对于传统区域分解法来说,通过两次缩聚策略进一步?#26723;土私?#38754;方程的规模,加快了其迭代收敛速度,从而大幅度减少了系统总的通信量。
(4)各子区域数据均可存储在相应节点机的局部存储空间,从而实现大规模数据的分布式存储。并行计算?#22791;?#23376;区域进程可直接从相应节点机的局部存储空间获取数据进行计算,从而有效提高了数据的内存访问速率。
附图说明
通过阅?#25947;?#29031;以下附?#32423;?#38750;限制性实施例所作的详?#35813;?#36848;,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明实施例中的结构动力分析计算模型示意图;
图2为本发明实施例中的两级分区策略示意图;
图3为本发明实施例中的两次缩聚策略意图;
图4为本发明实施例中的计算模型两级分区结果示意图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形?#36879;?#36827;。这些都属于本发明的保护范围。
多核分布式计算环境下结构分析的高效通信方法整体流程主要包括:首先通过两级分区策略生成并行计算所需的数据文件;接着同一节点机内的不同进程间相互通信,利用两次缩聚策略对求解问题的规模进行大幅?#20154;?#20943;;然后不同节点机的局部主进程间相互通信,利用分布式迭代求解器求解系统界面方程,再回代1级子区域内部自由度;最后各2级子区域进程从所在节点机的局部主进程接收1级子区域计算结果,然后提取自身边界自由度值,再回代内部自由度并计算应变、应力。若时间步结束则终止,否则重新从缩减求解问题规模开始执行。
本实施例中的结构动力分析计算模型示意图如图1所示。该模型为某塔楼-裙楼建筑结构在爆炸冲击载荷作用下的动力响应分析。爆炸发生时,在冲击波入射角为零度的结构正面受到的载荷远大于其它部位。故仿真计算时将爆炸冲击作用简化为对结构正面的右三角脉冲载荷,保留其峰值和持续时间特性。并行计算在上海超级计算?#34892;?#30340;“魔方?#32972;?#32423;计算机上进行。“魔方?#32972;?#32423;计算机是一个典型的多核大规模分布式并行计算机。它的每个节点机包括4颗AMD Barcelona1.9GHz四核处理器,64GB共享内存。故每个节点机总计4X4=16核,平均每处理器核4GB内存。在节点机内不同处理器核间通过AMD特有的HyperTransport总线互联,通信速度很快。而各节点机间采用Infiniband光纤网络联接,通信速度相对?#19979;?
下面按照系统操作的先后顺序依次作详?#38468;?#32461;:
第一步,通过两级分区策略生成并行计算所需的数据文件。METIS是国际著名的开源串行分区软件。ParMETIS是METIS的开源并行版,特别适合于大规模并行分区。本实施例将METIS和ParMETIS结合在一起实现两级分区功能。
如图2所示,结构有限元网格首先通过ParMETIS被并行剖分为M个1级子区域,然后每个1级子区域再进一步通过METIS被同时独立地剖分为N个2级子区域。为与多核分布式计算环境相适应,其中M应等于并行计算每次启动节点机总数,N应等于单个节点机内处理器总核数。?#20113;?#21160;16个节点机进行并行计算为例,结构动力分析计算模型的两级分区结果如图4所示。因本次并行计算启动的节点机总数为16,故该模型首先被ParMETIS并行剖分为16个1级子区域。又由于每个节点机合计16核,故各1级子 区域进一步通过METIS被同时独立地剖分为16各2级子区域。
第二步,通过依次在2级子区域和1级子区域上应用舒尔补方法进行缩聚达到大幅?#20154;?#32858;求解问题规模的目的。如图3所示,首先同时独立形成各2级子区域平衡方程,并经过缩聚消去其内部自由度;然后通过节点机内通信将同一节点机内所有2级子区域界面方程组集以形?#19978;?#24212;1级子区域平衡方程;再利用节点机内通信进行并行缩聚消去各1级子区域内部自由度,得到其仅与边界自由度相关的界面方程。采用舒尔补方法实现缩聚的基本公式为:
对于每个子区域,其广义刚度矩阵可分解为:
KIIKIBKBIKBB=L0RID00K*LTRT0I---(1)]]>
式中:分块广义刚度矩阵K中下标I代表内部自由度,下标B代表边界自由度;L为单位下三角矩阵,R为矩形矩阵,I为单位矩阵,D为对角矩阵,K*为对称矩阵,上标T表示转置矩阵。
由矩阵乘法的基本定理得:
KII=LDLTKIB=LDRTKBI=RDLTKBB=RDRT+K*---(2)]]>
每个子区域仅与边界自由度UB相关的界面方程可表示为:
K~UB=P~---(3)]]>
式中:为缩聚刚度矩阵,为缩聚载?#19978;?#37327;。
缩聚刚度矩阵和缩聚载?#19978;?#37327;可根据下式计算:
K~=K*=KBB-RDRT---(4)]]>
P~=PB-RL-1PI---(5)]]>
式中:PI为内部自由度对应的外部载?#19978;?#37327;,PB为边界自由度对应的外部载?#19978;?#37327;,上标-1表示逆矩阵。
第三步,利用并行预条件?#26597;?#26799;度算法求解系统界面方程,每个节点机只有一个进程——局部主进程参与开销相对较大的节点间通讯。该方法不需要组装系统总体界面方程。求解?#22791;?#23376;区域的缩聚刚度矩阵和缩聚载?#19978;?#37327;仍分布式存储在相应的节点机上,中间计算结果也以矩阵向量积的形式分布存储。局部通信只存在于具有相邻子区域关系的不同节点机间,只有少量的点积操作和整体迭代误差的计算需要节点机间全局通信。求解界面方程后,各局部主进程再同时独立回代1级子区域内部自由度。
第四步,各2级子区域进程从所在节点机的局部主进程接收1级子区域计算结果, 然后提取自身边界自由度值,再回代求解内部自由度以及应变、应力。若时间步结束则终止,否则重新从第二步开始执行。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修?#27169;?#36825;并不影响本发明的实质内容。

关于本文
本文标题:多核分布式计算环境下结构分析的高效通信方法.pdf
链接地址:http://www.pqiex.tw/p-6115956.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

[email protected] 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备17046363号-1 
 


收起
展开
平码五不中公式规律 必赢彩票 内蒙古11选5的前三走始 吉林十一选五前三直走势图表 黑龙江十一选五开奖结果查询结果 东莞股票配资招聘 60万股票融资可以融到多少钱 今日股票推荐怎么选 股票融资费用_杨方配资开户 中国福利彩票官方网站开奖时间 美国股票指数道琼斯走势