一、一种应用于矩阵计算的并行算法──行固定法(论文文献综述)
冯文卓[1](2019)在《基于国产超级计算机的并行有限元法研究》文中指出有限元法广泛应用于复杂精细结构的精确电磁仿真。该方法离散电磁场微分方程产生的稀疏矩阵性态较差,存在计算量大、迭代收敛慢等问题。本文基于国产超级计算机研究并行有限元法;在稀疏矩阵并行填充过程,研究基于图分割理论的均衡网格划分策略;在稀疏矩阵方程并行求解过程,研究高可扩展的并行直接求解算法。通过突破稀疏矩阵方程并行填充和求解关键技术,达到提升有限元计算速度和求解规模的目标。本文首先介绍了有限元迭代积分方程的基本原理。该技术能够尽可能少地引入额外计算量,具有较高效率。针对采用有限元方法计算复杂、电大尺寸目标时,面临的内存不足、计算耗时的问题,通过使用图分割理论的均衡网格划分策略以及稀疏矩阵重排序技术来提高程序的性能和可扩展性。图分割理论的均衡网格划分策略能保证网格均衡分区域划分,减少交界面网格数目,从而降低通信量;稀疏矩阵重排序技术是对填充的阻抗矩阵进行重排序,经过排序后提高数据的局部性和重用性。在我国“天河二号”超级计算机上成功突破1000 CPU核并行有限元计算,并行效率达到65%以上。通过以上的优化手段,并且在“天河二号”计算平台验证计算结果的可靠性之后在神威系列超级计算机上进行了电磁问题计算,成功突破2000 CPU核并行有限元计算,并行效率达到80%以上,先后计算验证了两千万未知量规模的金属散射问题、千万未知量的天线的辐射问题,并与HFSS的计算结果进行了对比分析,计算结果吻合。本文在国产超级计算机上利用异构并行技术,减少了计算时间,其中飞机散射计算有五倍的加速效果。验证了算法的可行性,为以后计算更大规模的电磁环境问题打下了基础。
胥永伟,程长征[2](2018)在《并行有限元计算切口应力强度因子》文中进行了进一步梳理为模拟切口的奇异应力场,需要在切口尖端精细划分单元,这使得有限元法的串行运算时间特别长。为了提高计算效率,文章针对单机多核系统,给出了切口应力强度因子的并行有限元计算方法。首先,在多核心的Windows系统上,采用全过程并行化的高斯消去法,缩短有限元程序求解时间。然后,基于并行有限元法获得的切口尖端应力场,使用后处理的方法计算切口的应力强度因子。算例结果表明,文中方法既能保证良好的计算精度,又能显着提高计算效率。
赵庶旭,朱正平,孙传庆[3](2004)在《基于MPI的并行计算系统构建及评测》文中研究指明利用普通微机(PC)构建高性能机群(Beowulf)同样可以获得强大的计算能力.针对在Beowulf系统中基于MPI环境的并行计算问题给出了可行的构建方案,对于如何解决负载平衡,针对MPI(MessagePassingInterface)并行编程环境下测试并行系统加速比编程比较困难的情况,介绍开发了一个矩阵相乘的通用并行算法模块,针对评测模型进行了性能测试,测试结果表明可以达到比较好的实际效果.
雷澜[4](2004)在《并行算法在矩阵计算中的应用研究》文中研究说明本文以并行算法及其应用为研究对象,重点研究了并行算法在矩阵计算方面的应用。在概述了并行处理技术与并行算法的基本概念之后,研究了矩阵乘法在分布式处理机上的并行处理技术,对MIMD上的矩阵乘法的并行算法进行了分析,给出了算法的实现步骤。并且分析了该算法的可扩展性和并行处理的效率。接着,研究了矩阵的特征值及特征向量求法的并行算法。先讨论了常见的QR法、分治法,接着在现有的二分法基础上,对算法加以修正;并在特殊情况下,设定了特征值的范围,简化了算法,提高了加速比,加快了算法的计算速度。对该算法进行了比较分析。最后,对论文存在的问题和应用前景进行了分析和展望。
沈文枫,郁松年,徐炜民[5](2000)在《一种应用于矩阵计算的并行算法──行固定法》文中提出行固定法是一种基于MPI并应用在高性能计算机系统上的并行算法,该算法很好地运用了矩阵的特性,不论用高斯消去法解线性方程组、还是对矩阵进行LU分解或者对矩阵进行m次幂计算的大规模并行计算时,由于该算法将各行的计算固定在各节点上,有效地实现了计算的局部性,减少了通信开销,从而获得了比较好的加速比.
二、一种应用于矩阵计算的并行算法──行固定法(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、一种应用于矩阵计算的并行算法──行固定法(论文提纲范文)
(1)基于国产超级计算机的并行有限元法研究(论文提纲范文)
摘要 |
ABSTRACT |
符号对照表 |
缩略语对照表 |
第一章 绪论 |
1.1 研究的背景及意义 |
1.2 国内外研究现状 |
1.3 本文的主要内容 |
第二章 电磁场有限元理论 |
2.1 引言 |
2.2 常用的数值分析方法 |
2.3 有限元变分公式 |
2.4 本章小节 |
第三章 有限元并行策略与优化性能方法 |
3.1 引言 |
3.2 集群系统硬件软件环境 |
3.2.1 集群系统的硬件组成 |
3.2.2 集群系统的软件组成 |
3.3 并行策略 |
3.4 稀疏矩阵并行直接求解算法 |
3.5 性能优化方法 |
3.5.1 基于图分割理论的网格分布 |
3.5.2 稀疏矩阵的重排 |
3.5.3 算例验证 |
3.6 计算案例 |
3.6.1 x86架构平台并行效率测试 |
3.6.2 工程应用 |
3.7 本章小节 |
第四章 基于国产超级计算机的并行有限元法 |
4.1 引言 |
4.2 异构并行加速 |
4.3 国产处理器平台并行效率 |
4.4 散射案例 |
4.5 辐射案例 |
4.6 本章小结 |
第五章 工作总结与展望 |
5.1 工作总结 |
5.2 工作展望 |
参考文献 |
致谢 |
作者简介 |
(2)并行有限元计算切口应力强度因子(论文提纲范文)
0 引言 |
1 OpenMP并行框架与并行高斯消去法 |
1.1 OpenMP并行框架 |
1.2 OpenMP并行高斯消去法 |
2 切口应力强度因子的计算 |
3 数值分析 |
3.1 并行计算加速性能研究 |
3.1.1 不同机型对并行计算的影响 |
3.1.2 不同高斯消去法对并行计算的影响 |
3.1.3 不同数据块对并行计算的影响 |
3.2 切口应力强度因子研究 |
3.2.1 对称切口试件 |
3.2.2 斜切口试件 |
4 结论 |
(3)基于MPI的并行计算系统构建及评测(论文提纲范文)
0 引言 |
1 Beowulf系统硬/软件构建 |
2 矩阵相乘的通用并行算法模块设计实现 |
3 性能评测 |
4 结束语 |
(4)并行算法在矩阵计算中的应用研究(论文提纲范文)
中文摘要 |
英文摘要 |
1 绪论 |
1.1 问题的背景及研究的意义 |
1.2 国内外研究现状 |
1.3 本文工作简介 |
2 并行计算机理论基础 |
2.1 并行计算机的定义 |
2.2 并行计算机分类 |
2.3 并行计算机体系结构 |
3 并行算法理论基础 |
3.1 并行算法的定义和分类 |
3.2 并行算法的发展 |
3.3 并行算法性能度量 |
3.4 并行算法的基本实现方法 |
4 并行算法性能度量 |
4.1 并行算法的运行时间 |
4.2 问题的规模与分类 |
4.3 并行机规模 |
4.4 并行度与粒度 |
4.5 加速比与效率 |
4.6 阶的表示 |
4.7 成本 |
4.8 计算步与通讯步 |
4.9 同步障碍因子 |
4.10 可扩展性 |
5 矩阵乘法的并行计算及可扩展性分析 |
5.1 矩阵乘法的内积算法 |
5.2 斯特拉森(Strassen)算法 |
5.3 多处理机上的矩阵乘法 |
5.4 MIMD处理机上的矩阵乘法 |
6 特征值与特征值向量的并行计算 |
6.1 预备知识 |
6.1.1 QR方法 |
6.1.2 割线法 |
6.1.3 Rayleigh 商加速与Rayleigh 商迭代 |
6.2 对称三对角特征值矩阵特征值问题的并行计算 |
6.3 对称带状矩阵特征值问题的并行计算 |
6.3.1 二分法及其改进 |
6.3.2 r=3时的二分法及其改进 |
6.4 可扩展性分析 |
7 结 语 |
7.1 存在的问题 |
7.2 展望 |
致 谢 |
参考文献 |
附录 |
1. MIMD矩阵乘法的实现程序 |
2 作者在攻读硕士学位期间取得的成果 |
四、一种应用于矩阵计算的并行算法──行固定法(论文参考文献)
- [1]基于国产超级计算机的并行有限元法研究[D]. 冯文卓. 西安电子科技大学, 2019(02)
- [2]并行有限元计算切口应力强度因子[J]. 胥永伟,程长征. 合肥工业大学学报(自然科学版), 2018(10)
- [3]基于MPI的并行计算系统构建及评测[J]. 赵庶旭,朱正平,孙传庆. 兰州交通大学学报, 2004(04)
- [4]并行算法在矩阵计算中的应用研究[D]. 雷澜. 重庆大学, 2004(01)
- [5]一种应用于矩阵计算的并行算法──行固定法[J]. 沈文枫,郁松年,徐炜民. Journal of Shanghai University, 2000(S1)