一、基于交错网格的高效离散格式(论文文献综述)
王文化[1](2021)在《高精度有限差分法波动方程正演及逆时偏移研究》文中研究说明有限差分法广泛应用于各类波动方程的正演模拟,是地震逆时偏移和全波形反演的基础。但是由于网格离散化造成的数值频散是有限差分法不可避免的问题,低阶数、粗网格或者高频时产生的数值频散现象会严重影响波动方程正演模拟的精度。目前已经提出和发展了多种用于压制有限差分数值频散的方法,但是略为遗憾的是它们大多不能同时兼顾计算效率和精度,如何能在不牺牲额外计算效率的同时有效压制有限差分法波动方程正演中的数值频散仍然是需要进一步解决的问题。本文主要围绕有限差分法波动方程正演的模拟精度和计算效率问题展开研究。从时间域有限差分格式的基础理论出发,利用基于Remez算法的常系数优化方法推导具有等波纹特性的空间导数显式、隐式差分系数,引入时间频散变换(TDTs)解决时间频散误差,以声波方程为例实现了相关的叠前逆时偏移成像。论文的主要工作及创新研究内容如下:(1)基于泰勒级数展开方法(TE)分别求解了空间导数的显式差分系数(EFDCs)和隐式差分系数(IFDCs),并且进行了差分精度对比分析。理论分析表明:在相同阶数时,利用IFDCs近似空间导数的精度明显高于EFDCs;在相近的精度要求下,IFDCs所需的阶数明显小于EFDCs;此外,这两种方法在阶数增加到一定程度时精度的提高会趋向于饱和。(2)分别推导了时域有限差分法声波方程、弹性波方程和双相介质波动方程正演的离散格式,并且分别给出了PML吸收边界条件下的有限差分离散表达式。此外,系统研究分析了传统时域有限差分法声波方程、弹性波方程和双相介质波动方程正演模拟的数值频散问题和稳定性条件。相应的数值算例表明:PML吸收边界条件能很好的解决边界反射问题;相同阶数下基于IFDCs所得波场的的空间频散误差小于EFDCs,但前者的时间频散误差问题会更为严重;IFDCs的稳定性条件限制会比EFDCs更为严格。(3)研究了基于最大范数、二范数和一范数优化有限差分系数的具体过程,并且分别利用模拟退火(SA)、最小二乘(LS)和交替方向乘子法(ADMM)求解利用不同范数建立下空间导数算子的目标函数。本文将Remez算法推广用于求解空间导数的隐式差分系数,数值频散曲线分析表明此算法求解下的空间隐式差分系数能以最小的阶数(2M≤20)获得接近谱精度的波数覆盖范围。此外,结合常系数优化方法和时间频散变换(TDTs)同时解决时间二阶、空间高阶格式下声波方程正演的时间频散和空间频散。数值实验证明:当空间方向存在数值频散误差时,利用TDTs不能完全去除时间数值频散误差,甚至还会加重空间方向的频散误差;空间精度越高,TDTs的时间频散误差去除效果越好;基于Remez优化的隐式有限差分方法(OIFDM)的空间频散误差和频散各向异性程度最小,它结合TDTs后增加的额外空间数值误差也最小。本文还将Remez算法优化得到得隐式差分系数推广用于弹性波方程、双相介质波动方程的正演模拟。(4)研究了逆时偏移成像的基本原理,简要介绍了激发时刻成像条件、上下行波振幅比成像条件和互相关成像条件。深入讨论了逆时偏移低频噪声的产生机制。本文将提出的基于Remez算法优化的隐式有限差分系数用于不同模型的声波方程叠前逆时偏移成像,数值实验表明相比传统显式TE方法,其可以显着提高成像精度和计算效率。本文从地震波场导数的有限差分法数值求解出发,较为系统的研究了时域有限差分法波动方程正演模拟的基础框架和方法理论,并且在此基础上实现了基于高精度有限差分数值模拟的逆时偏移成像。研究算例均表明,这些原创性和推广性的工作显着提高了有限差分法波动方程正演与逆时偏移的精度和效率。
张文强[2](2020)在《破裂动力学的曲线网格有限差分方法研究及高性能计算》文中认为大地震通常发生在活动断层上,其高速的失稳破裂导致强烈的强地面运动辐射场,造成人员伤亡和财产损失。通过地震动力学的研究,可以加深人们对强地面震动致灾机理的理解,从而更好地防震减灾。数值模拟是研究地震动力学的有效手段,其中,曲线网格有限差分方法(CGFDM)(Zhang et al.,2014a)借其描述复杂边界的灵活性以及方法本身的高效性,已经成为模拟非平面断层破裂的成熟方法。本文改进了原先的CGFDM方法,通过修改断层边界条件施加的数值方式,解决了原格式需要滤波才能处理的数值不稳定性问题。CGFDM方法基于一阶速度-应力方程组,其中对于断层边界条件的数值处理过程包括两个方面:(1)应力空间导数的处理,本文将牵引力镜像法和基于分裂节点的试应力法结合起来,避免了原来的CGFDM方法中通过降阶求解分裂节点的应力空间导数的过程;(2)速度空间导数的处理,本文利用已知的断层牵引力来处理断层边界处难以求解的速度空间导数。本文将改进的CGFDM方法用于粗糙断层的模拟,并与原来的CGFDM进行比较。结果表明,改进的CGFDM方法可以在不施加滤波的情况下解决粗糙断层破裂过程模拟中的数值不稳定性问题。断层破裂过程受摩擦准则控制,因此,不同的摩擦准则对断层破裂方式有很大影响。相比于较为简单的滑动弱化摩擦准则,速率状态准则不仅能描述断层高速失稳破裂过程,也能给出断层摩擦力恢复的过程,这对于理解地震的完整周期过程非常重要。本文将已有的曲线网格有限差分方法推广到速率状态准则下,并与标准测试模型的其他数值方法计算的结果进行对比。虽然曲线网格有限差分方法相对于有限元等方法已经非常高效,但是模拟大规模的三维断层破裂过程仍然是十分低效的,这限制了很多研究的开展。为此,我们开发了基于GPU架构的破裂动力学程序。本文的GPU程序在保证正确性的同时,相对于单核CPU程序有两个数量级的加速比,即使相对于多核CPU程序也依然具有巨大的优势,这极大地方便了破裂动力学模拟相关的研究。准确模拟断层破裂过程引起的强地面运动辐射场对于地震灾害分析非常重要。本文在神威·太湖之光超级计算机上实现了高分辨、高频的强地面运动过程模拟。以唐山大地震为例,分析了网格分辨率对存在复杂沉积盆地下的强地面运动模拟的影响。研究发现,粗网格在盆地结构复杂的区域不能准确地解析合成地震图的低频分量。本文的工作强调了超级计算机在复杂大地震模拟中的重要作用,对利用数值方法计算复杂沉积盆地下的震害分布等研究工作也具有一定的参考作用。本文通过对破裂动力学方法研究以及高性能计算的深入拓展,进一步提升了破裂动力学数值模拟方法的可靠性和高效性。使用本文拓展的高效CGFDM方法可以更方便地开展设定地震模拟等研究工作进行活断层区的震害预测,这将对防震减灾工作具有重要参考价值。
陈炳炜[3](2020)在《面向复杂地形地震模拟的并行优化方法研究》文中指出地震模拟对于完善地震学理论和抗震救灾等都具有重要作用,但大规模地震模拟在计算和存储方面都面临严峻挑战。基于“神威·太湖之光”超级计算机,已有工作采用有限差分方法实现了唐山地震的高效高精度模拟。然而,我国大多数地震发生于川滇地区等地形复杂的区域,无法使用传统的有限差分方法准确模拟地形效应的影响。在前述唐山地震模拟工作的基础上,本文引入曲线网格以精确描述复杂地形,并针对新算法更复杂的计算和数据特性,提出进一步的并行和优化方法,将汶川地震模拟高效扩展至上千万核。本文的主要贡献包括:·为有限差分算法引入了曲线网格等前沿特性,使其可精确描述复杂地形对地震波传播的影响;并在此基础上,通过算法的重新设计提高地震模拟在大规模并行异构系统上的效率;提出多级网格划分方案,并结合网络通信和IO通信的优化,成功扩展至“神威·太湖之光”整机规模。·为了获得性能的进一步提升,在内存利用率方面,分别从二维和三维角度探究了最优化方案;在内存带宽方面,提出了变量融合方法、网格点重排列和协作存取模型;在计算效率方面,分别针对两种应用场景提出了向量化策略。·考虑到E级超算对混合精度的普遍支持,在上述工作已实现对神威硬件全面利用的基础上,采用可重构计算平台,研究和探索面向地震模拟的混合精度计算方法;通过模拟结果的数值分析,获得不同变量所需的位宽和动态缩放因子,从而为地震模拟设计定制化的数据流处理器。针对汶川地震这一模拟场景,本文的并行优化方法在“神威·太湖之光”整机上取得了9.07 Pflops的持续运行性能,并从模拟结果上验证了复杂地形对波场造成的影响。在可重构计算平台上,本文的混合精度并行优化方法在保证数值和波场正确性的前提下,取得了相当于13.1个Intel Xeon Gold 6154(18核)处理器或2.1个SW26010节点(260核)的计算性能。上述结果展示了本文所提出的方法和软件对复杂地形地震的精准模拟能力,以及在顶尖超算系统上良好的计算效率。所提出的混合精度计算方法为地震模拟在未来E级系统上的高效运行奠定了基础,预期将为地震领域的研究工作带来相应的推动作用。
陈健军[4](2020)在《求解Helmholtz方程的非紧致优化四阶有限差分法》文中认为Helmholtz方程具有重要的理论意义和应用价值,它常常用来刻画声学,光学和电磁学等科学领域的波传播和逆散射等物理现象.Helmholtz方程在航空航天,海洋技术和油气勘探等技术领域中有着广泛的应用.建立Helmholtz方程有效的数值模拟方法是若干科学和技术领域中的一项重要研究内容.特别是当波数较大的时候,Helmholtz方程的解具有高度震荡性,数值解的精度通常随着波数k的增加而降低.因此,在计算科学领域,数值求解高波数Helmholtz方程仍然是一项艰巨的任务.本文基于泰勒公式和频散极小化机制构造高阶有限差分法对Helmholtz方程进行高效的数值求解,具体内容如下:第一章为综述部分,主要介绍了Helmholtz方程的应用背景,以及数值求解Helmholtz方程所遇到的问题.在第二章中:提出了求解Helmholtz方程的非紧致优化25点四阶有限差分法.第1节专门针对2D Helmholtz方程,提出三组四阶差分格式用于离散高阶导数项(35)u;在第2节中提出三组四阶差分格式对零阶项k 2u进行离散,并结合高阶项的离散得到非紧致优化25点四阶有限差分法;在第3节给中给出截断误差分析.在第三章中:对提出的非紧致优化25点四阶有限差分法做频散分析.第1节对非紧致优化25点四阶有限差分法做频散分析,给出频散误差以及频散关系式;第2节通过频散关系式得到权重参数的求值方案;第3节给出归一化相速度曲线图用于说明非紧致优化25点四阶有限差分法在压制数值频散方面的有效性.在第四章中:提出了相应的匹配界面和边界(MIB)方法来处理边界问题.第1节介绍非紧致高阶差分方案的边界处理问题以及已有的工作;第2节回顾了匹配界面和边界(MIB)方法的构造方法;第3节提出了针对非紧致优化25点四阶有限差分法的匹配界面和边界(MIB)方案.在第五章给出了数值算例,并于不同的差分方案进行对比.并给出一些结论和展望.
陈宏博[5](2020)在《基于异构众核处理器的有限差分算法并行优化》文中研究表明有限差分算法一直都是偏微分求解过程中的核心求解方法,但是在面对大规模科学计算应用时,普通处理器的计算效率难以满足应用的需求。“神威·太湖之光”超级计算系统,是世界上第一个性能超过100Pflop/s的超级计算机系统,内部集成了40960个申威26010异构众核处理器。申威26010异构众核处理器具有独特的系统架构。目前,针对有限差分算法的计算,还没有一种优化方案可以完全发挥申威26010异构众核处理器高超的计算性能。为了提高有限差分法求解的效率,本文基于“神威·太湖之光”超级计算机系统,针对地震波正演模拟与通用地球系统模式中以有限差分法为核心计算函数,存在并行效率过低的问题,设计出了多种多级异构并行优化方案。本文根据申威26010异构处理器的架构特点,分析“神威·太湖之光”超级计算系统在处理有限差分算法相关的密集型算法时的主要性能瓶颈。研究了基于“神威·太湖之光”超级计算系统上的有限差分方法的多级并行优化。针对并行过程中出呈现的MPI消息传递效率低、处理器带宽造成通信效率低下、处理大规模数据LDM空间无法满足计算需求等问题,研究了MPI、Sunway Athread、SIMD向量化等并行方法,设计出纵向数据划分、链式通信、2.5-D流水线、捆绑通信、异步通信等多级异构并行优化策略。主要的优化工作如下:(1)地震波有限差分法交错网格格式两级并行优化方案。针对一级并行中MPI消息传递耗时的问题,重新划分了数据的分配方案,有效的减少了消息传递的次数,提高了一级并行的并行效率。同时,通过二级并行策略,有效缓解了一级并行方案中呈现出内存占用过大导致无法计算大规模模型的问题。二级并行中因处理器访问主存带宽的限制,导致数据访问延迟,造成计算核心无法发挥其高效的计算性能。因此,通过神威内部线程库使用DMA通信的方式,将数据从主存加载到计算核心局部存储器(LDM)中。为了使DMA发挥其最大性能,本文设计出链式读取数据的策略,但当数据增加到三维,LDM存储空间难以满足计算的需求,因此本文提出了2.5-D流水线法,缓解了数据存储压力,同时2.5-D流水线也方便方便了异步通信方案的实施。在地震声波正演中使用128进程8192线程进行多级异构并行性能测试,结果显示较优化前取得了1250.97倍的加速效果。(2)通用地球系统模式中有限差分相关函数的多级并行优化方案。在之前的优化策略上,增加向量化级别并行进一步提高了并行效率。深入研究处理器内部寄存器通道,设计出捆绑通信策略。该策略有效缓解通信优先策略与存储优先策略之间的冲突。向量化级别并行中,研究了vshff数据置换方式,减少向量数据封装过程中的消耗。在单个核组内对两个以有限差分为核心计算的函数进行并行性能测试,分别取得了9.9倍和21.2倍的加速。综合以上两项工作中的优化策略,本文主要研究了以有限差分法为代表的密集型算法在“神威·太湖之光”超级计算机系统上的并行优化。从测试的结果显示,本文提出的多种并行策略,有效缓解了因硬件设计造成的带宽瓶颈,并取得了理想的加速效果,为以后其他算法在神威上的移植奠定了基础。
万嘉伟[6](2020)在《龙格-库塔法数值求解基于有限体积的不可压Navier-Stokes方程和流固耦合问题》文中进行了进一步梳理本文以求解非交错网格上不可压Navier-Stokes(N-S)方程以及多相(即由流体子系统及其动网格和结构子系统组成的)流固耦合问题为研究对象,以有限体积法为基础,研究探讨其中所涉及的数值求解问题和方法。不可压N-S方程属于低速流体(流速小于0.3马赫)运动控制方程,其一般形式在数学上为偏微分方程。针对N-S方程的数值求解可分为两步:首先,选用一种合适的离散方法(如有限差分法,有限体积法和有限元法)对方程在计算域内进行空间离散,从而得到计算域内各个离散点上的速度微分方程和压力代数方程,这些离散点构成了计算网格;然后,时域求解经空间离散得到的微分方程和代数方程系统,获得离散点上速度和压力在不同时刻的数值解。经有限差分法、有限元法或交错网格上的有限体积法离散得到的不可压N-S方程可被视为指标2微分代数系统(数学上,同时包含微分方程和代数方程的系统被称为微分代数系统,并引入指标概念来区别不同类型的微分代数系统。常见的微分代数系统有指标1、指标2和指标3三种。指标数越高,其对应的微分代数系统越复杂)。但是,在工程应用中,非交错网格上的有限体积法被更广泛的应用。而经非交错网格上的有限体积法离散得到的不可压N-S方程是无法被直接认定为指标2微分代数系统。这是因为,在进行空间离散时,需要添加动量插值这一特殊操作来得到非交错网格单元界面上的离散速度场。单元界面上的离散速度场作为一个新参变量,与网格单元中心上的离散速度场和压力场,共同参与到N-S方程的空间离散过程中来。动量插值的插值格式最先由Rhie和Chow提出。在现有研究中,动量插值对空间离散后N-S方程的微分代数属性的影响从未被探究过。该影响若不明确,将无法有效分析时间离散方法在求解基于非交错网格和有限体积法的不可压N-S方程时的精度。此外,动量插值在的数值上实现的难易程度与时间离散格式的复杂程度也息息相关(例如,对于基于龙格-库塔法的时间离散格式,动量插值需消耗大量的计算资源)。针对以上问题,本文首先提出了一种新的动量插值格式。该动量插值格式具有区别于其它格式的两个显着特点:1、插值对象是半离散(即仅经过空间离散)的N-S方程而非完全离散的方程;2、插值前,需对N-S方程中的对流项和扩散项按特定的格式进行拆分和重组,此特定格式依赖于定义在网格单元界面上的系数。采用本文新提出的动量插值格式,经空间离散后的不可压N-S方程可被严格认定为指标2的微分代数问题。本文还对新动量插值格式的精度、收敛性以及它能否在静止或运动网格上维持恒定均匀流的流场状态依次进行了检验。依据以上提及的N-S方程数值求解步骤,本文的第二大研究问题为:时域求解经空间离散得到的微分方程和代数方程系统(即微分代数问题的求解)。这一求解步所运用的数值方法被称为时间离散方法(或时间积分方法)。N-S方程的计算域可以是静止的,也可以随边界的运动而变化。在后一种情况中,如果运动边界为可变形或移位的结构体与流体的接触面,那么在对N-S方程进行空间离散的同时还需要引入结构运动方程以及适应于运动边界的网格运动方程,这便是前述的多相流固耦合系统。通过时域求解该系统,可以获得流体和结构在不同时刻的响应。常用的微分代数问题数值求解方法包括多步法和龙格-库塔法两大类。与多步法相比,龙格-库塔法具有精度高、稳定性强、可自适应时间步长和自启动等优点。值得一提的是,多步法和龙格-库塔法最初都是为了求解常微分问题而提出。微分代数问题与常微分问题具有不同的性质,且前者求解难度更高。同一数值方法在常微分问题和不同指标的微分代数问题中的局部精度和整体收敛阶次都有可能不同。现有研究还没有广泛认识到空间离散后的N-S方程属于微分代数问题而非常微分问题这一事实,许多研究默认数值方法在常微分问题中的局部和整体误差阶数与其在时域求解N-S方程时的局部和整体误差阶数一致。从应用角度来看,基于向后差分的多步法在开源和商业计算流体力学软件中被广泛运用,而龙格-库塔法在求解N-S方程中的应用研究仍然停留在学术层面。而且,学术界对于具体哪些类型的龙格-库塔法更适合于N-S方程的时域求解,以及如何简单高效的使用它们尚未达成共识。基于以上原因,本文以求解不可压N-S方程和流固耦合问题为目标,对现有的龙格-库塔法进行了改进和创新,进而构建具有低内存占用,易实现和高阶收敛等优点的数值求解方法。具体研究内容包括一下三个方面:(1)以静止网格上的半离散不可压N-S方程为求解对象,将其视为特殊的指标2微分代数问题,提出了一种新的隐式龙格-库塔法。与传统方法相比,该方法能够显着提高计算效率以及压力数值解在非定常速度边界问题中的整体误差的收敛阶次。在所有隐式龙格-库塔法中,满足stiff-accurate条件的对角隐式龙格-库塔(DIRK)法因其计算量偏小等特点而更具有优势。当半离散不可压N-S方程的真实解存在且光滑,本文新提出的方法能够使DIRK格式求得的速度和压力数值解均按经典阶数(即DIRK法在常微分问题中的局部精阶数)收敛。在此方法的基础上,本文进一步构建了两类低内存占用的满足stiff-accurate条件的DIRK格式,从而减少内存消耗。(2)以动网格上的半离散不可压N-S方程和多相流固耦合问题为求解对象,本文提出了一种特殊类型的分离式龙格-库塔法(命名为含显式子步的分离对角隐式龙格-库塔法,简称PEDIRK法)。该方法由一般的分离式龙格-库塔法衍变而来。PEDIRK法改善了现有对角隐式类型的龙格-库塔法在一般非线性指标2微分代数问题中的收敛性。分离式龙格-库塔法区别于一般的龙格-库塔法,这种方法通过引入一组额外的龙格-库塔系数和子步微分分量来实现更高精度的求解。同样,本文也为该方法提供了低内存占用且便于动量插值的数值格式,从而进一步提升计算效率。(3)研究探讨不同类型的龙格-库塔方法导出的离散N-S方程求解问题。N-S方程对流项的非线性,以及速度与压力的耦合效应给方程的求解带来了困难。本文将研究点放在如何突破这些难点,建立能在计算效率、求解精度以及软件模块化三项因素中取得良好平衡的迭代求解算法。本文还讨论分析了离散N-S方程的求解残差对数值解整体误差收敛性的影响。以上提出的龙格-库塔法和创建的具体格式不仅可以用于求解N-S方程和流固耦合问题,还可用于求解数学领域一般的微分代数问题。最后,本文开展了三项数值算例,用以检验新提出的动量插值格式以及龙格-库塔法的精度和收敛性。第一组算例采用不同的边界条件和空间离散格式对若干雷诺数下二维的泰勒格林漩涡进行模拟。第二组算例为振动圆柱的绕流问题。其中,圆柱振动模式分为垂直来流向的简谐振动,以及顺来流向和垂直来流向的耦合自由振动。第三组算例为理想平板颤振导数识别。通过以上数值算例,本文所提出的一系列方法的收敛性都被一一验证。
刘勇[7](2020)在《间断有限元方法和随机偏微分方程的缩减基方法的研究》文中研究表明本文研究间断有限元(discontinuous Galerkin,简称DG)方法求解偏微分方程的数值分析,及其在可压缩磁流体动力学(Magnetohydrodynamic,简称MHD)中的数值模拟,以及利用缩减基方法(reduced basis method,简称RBM)加快对随机偏微分方程的数值求解。论文主要分成两个部分。第一部分包括DG方法的数值分析和MHD数值模拟的研究。数值分析上,我们主要利用一种平移技术构造了一种全新的特殊投影算子,并分析了投影算子的有界性,证明了对于线性的双曲守恒律方程,交错网格上的中心间断有限元(central DG,简称CDG)方法的半离散格式的最优误差估计。在均匀交错的网格下,对于一维情形,基于分片pk元(k次多项式有限元空间),我们证明了 k+1阶L2范数的误差估计。对于多维情形,证明了在均匀的笛卡尔交错网格下,有限元空间采用分片Qk元(每个分量k次多项式的张量积),L2范数同样有最优收敛阶。利用这种投影算子,帮助我们处理CDG的空间离散部分获得最优收敛阶的证明。数值算例同样验证了我们理论结果的最优性。我们继续利用这种平移技术证明了在二维的均匀矩形网格下,基于分片pk元的经典半离散DG格式对于标量双曲方程有最优k+1阶收敛。我们分别对于三种情形给出证明,分别是线性常系数,线性变系数和非线性情形。除了最优误差估计的研究,我们对一种具有最优阶的能量守恒DG方法,研究其超收敛性质。利用构造修正函数的技巧证明了半离散的数值解在节点的数值流通量和单元平均值具有2k+1阶的超收敛,以及数值解k+2阶地超收敛于真解的一种特殊投影。我们还发现DG的近似解的导数值和函数值在某些特殊点处分别以k+1和k+2阶的精度超收敛。此外,数值计算上,我们研究了DG方法对可压缩磁流体动力学的数值模拟。我们发展了两种数值格式,分别是笛卡尔坐标系下的熵稳定的节点DG格式和柱坐标下的局部磁场散度为零的DG格式。在笛卡尔坐标系下,针对结构网格,我们考虑可对称化Godunov形式的MHD方程,分析了半离散格式的熵稳定性质。通过设计合适的积分公式,熵守恒的数值流通量以及单元边界的熵稳定数值流通量,使得数值格式满足熵稳定。对于MHD方程另一个重要的物理性质,磁场散度为零,我们针对柱坐标(r,φ,z)下的MHD方程设计了 3维的满足局部磁场散度为零的谱-DG方法。由于特殊的物理问题的性质,我们对于φ方向采用傅里叶谱方法进行数值近似,使用DG方法离散(r,z)空间。我们构造了磁场的局部散度为零的函数集合保证每个单元内部磁场的散度为零。数值算例验证了我们算法的有效性。第二部分是关于缩减基方法对于随机微分方程的应用。我们针对线性(常微和偏微)的任意类型噪声(不一定是Gaussian噪声)驱动的随机微分方程提出,分析并实现了一种新的缩减基方法。我们的算法主要有四个特点。首先,我们提出了一种新的时空处理方法对于时间依赖的ODE和PDE数值格式。第二个是一种保证精度的高效空间分量压缩技术用于RBM的基函数。第三个是对于非参数化问题提出一种非常规的参数化方法。最后是RBM是没有明显的离线过程的,但是仍然有高效的在线过程处理得到的参数化问题。数值结果表明我们的算法的有效性和鲁棒性。
齐亚强[8](2019)在《高性能界面两相流数值模拟方法的构建及性能分析》文中研究指明界面两相流在航空航天、石油化工、能源动力等工业领域中广泛存在,快速、精确地捕捉相界面对于研究两相流的内在机理以及工程实际应用都具有重要意义。由于界面附近物性参数变化剧烈、界面运动复杂多变等原因,数值模拟耗时往往较长,因此,构建一种精确高效的界面两相流模拟方法一直是国内外学者长久以来关注的一个问题。近年来,本人所在团队成员提出了一种复合界面捕捉方法—VOSET,该方法既可以保证质量守恒,又可以精确计算表面张力和光顺界面附近物性参数,获得光顺的高分辨率相界面,但仍面临计算效率较低这一问题。因此,本文将针对现有的VOSET方法,通过在网格系统、速度压力耦合算法和代数方程组求解方法三个层面对其进行改进,最终开发一种更高效的界面两相流模拟方法。(1)在网格系统层面,由于交错网格系统内包含有速度和压力等多套网格,导致计算过程异常复杂,为了解决这一问题,本文构建了基于同位网格系统的VOSET+SIMPLE方法,并通过三个经典算例验证了同位网格VOSET+SIMPLE方法的可行性和精确性。(2)在速度压力耦合算法层面,本文采用高效的IDEAL算法代替传统的SIMPLE算法,并通过三个算例验证了同位网格VOSET+IDEAL方法的高效性。(3)在代数方程组求解方法层面,首先,本文研究了G-S、ADI、SIP、Bi-CGSTAB和BCT-Bi-CGSTAB五种不同代数方程组求解方法对非稳态两相流模拟方法求解性能的影响规律,并最终确认BCT-BiCGSTAB方法在同位网格VOSET+IDEAL方法中具有最佳的求解性能。然后,为了进一步减少VOSET+IDEAL+BCT-Bi-CGSTAB方法在求解复杂问题时的计算耗时,本文引入了可快速降低低频误差消减速度的多重网格方法,并以高效的BCT-Bi-CGSTAB方法作为光顺算子,构建了更加高效的VOSET+IDEAL+多重网格(BCT-Bi-CGSTAB)非稳态两相流模拟方法,通过算例对比,发现该方法相比VOSET+IDEAL+BCT-Bi-CGSTAB方法在求解效率方面进一步得到大幅提升。通过以上研究,本文构建了一种用于精确高效模拟界面两相流的同位VOSET+IDEAL+多重网格(BCT-Bi-CGSTAB)方法,并开发了相应的软件,这一研究成果将为揭示界面两相流的内在原理、完善两相流流动的理论体系、特别是为指导实际工程应用提供强有力的数值支撑。
肖祥云[9](2019)在《基于深度神经网络的流体动画研究》文中研究说明基于物理的计算机流体动画模拟是目前计算机图形学领域内的重要研究方向之一,在影视特效制作、游戏模拟、灾难仿真等应用场景中,计算机流体动画模拟都有着极其重要的应用价值。随着人们对电影、游戏等视觉效果要求的提高,以及工业与科学应用需求的不断深化与增长,各种传统的计算机流体动画模拟方法均面临着前所未有的挑战。因此,如何更为有效地、快速地、逼真地实现大规模、高精度、高质量的烟雾、水流等自然流体现象的模拟计算,便成了计算机图形学中最为热门的研究方向之一。在传统的基于欧拉网格法的流体动画模拟框架中,投影步求解过程往往是计算资源和计算时间消耗占比最大的一个部分,特别是对于高精度、高分辨率的大规模流体应用场景,传统的计算机流体动画模拟算法不论是在计算速度上,还是在模拟效果上,均存在明显不足。例如,大多数流体模拟模型缺乏有效的投影步计算加速方案,无法兼顾计算精度与计算效率,且存在着算法应用高时耗、编程实现复杂、计算内存消耗巨大等缺点。特别地,目前大多数流体模拟加速算法对流体模拟的核心问题——泊松方程的数值求解存在着诸多问题。在欧拉网格法的流体动画模拟框架中,投影步的泊松方程离散一般会产生大型稀疏线性方程组,对于大部分数值计算方法,例如预处理共轭梯度法(PCG),则需要通过多次迭代求解才能得到稳定的收敛解,这也使得整个流体模拟计算过程无法形成快速、高效的计算模式。另外,由于数值计算算法的数值粘性和计算误差在不同分辨率的流体场景中存在着不同的表现,使得高-低分辨率情况下,模拟结果在物理形态上产生了巨大差异,严重地降低了流体模拟算法的用户交互能力,同时也在很大程度上提高了用户的时间消耗与预览成本。同时,目前很多基于深度学习的模拟算法,受到了流体变量在离散空间内的数据高维性所带来的巨大限制,无法更为有效地进行模拟加速和流体本质特征的研究,从而进一步影响了该类模拟与加速算法的实际应用与推广。基于以上问题与挑战,本文同时考虑了计算机流体动画模拟在计算精度、仿真效率上的需求,将模拟算法的高实时性、高可交互性、高物理准确性等作为研究重点与目标,针对包括烟雾、液体等自然现象的模拟关键性问题,提出了基于深度神经网络框架的求解算法与加速方案。随着人工智能技术的深入发展,深度神经网络模型以其强大的数据学习能力,被广泛应用至计算机图像分类、语音识别、流体细节合成等研究领域。其稳定的、高效的计算模式,为计算机流体动画模拟提供了一种新的问题解决途径。因此,本文以深度神经网络为基本算法框架,对基于物理的流体动画模拟与加速进行了以下几个方面的研究:·提出了基于深度神经网络(DNN)的流体投影步加速算法。针对传统的基于欧拉网格法流体模拟框架中,投影步计算过程高耗时、高耗资源的问题,本文提出了一种基于深度神经网络模型的加速解算方法,以深度学习计算模型替代传统的流体模拟投影步求解器,提升了整个投影步计算效率。同时,本文提出了相应的基于网格块(Patch-based)所构建出的输入输出特征向量,降低了流体模拟变量数据本身的高维性与复杂性对深度学习网络模型训练与预测效率的影响。我们还在训练模型的损失函数中融入了流体速度场的散度信息,有效地控制了流体预测结果的不可压缩性性质。通过与传统的投影步迭代求解方法相比较,该深度神经网络算法可以将整个投影步计算过程提速17倍以上。同时,针对基于深度神经网络的流体投影步加速计算模型的算法普适性与鲁棒性问题,本文进一步提出了基于深度增量学习方法的自适应流体投影步加速方法。本文提出了以求解“快速模式”和“普通模式”为基础的投影步自适应计算框架,将经典的预处理共轭梯度法(PCG)与基于深度神经网络投影步求解模型相结合。该框架以深度增量学习方法为核心,通过对预测场景的自学习来快速更新“快速模式”中的深度神经网络模型,最终可以满足复杂的、远离训练数据的流体场景快速模拟需求。·提出了一种新的基于深度卷积神经网络(CNN)的泊松(Poisson)方程快速求解算法。本文首先通过对流体泊松方程离散化求解过程中所产生的大型稀疏线性方程组进行分析,提出了基于全局的、具有严格多层几何结构的网格单元划分与处理方法,并以此为基础,对泊松方程的矩阵-向量特征信息进行提取,构建了相应的深度学习模型的特征输入矩阵与输出向量。同时,我们还建立了多样性训练数据生成系统,结合人工训练场景生成和随机训练场景生成,解决了深度学习模型的训练样本生成问题,为深度学习模型提供了丰富的多样性训练数据。该算法以解决投影步所产生的泊松方程求解的本质性问题——大型稀疏线性方程组Ap=d的求解问题为出发点,通过对烟雾、液体等复杂流体场景的模拟实验与测试,并与包括ICPCG、MIC(0)-PCG、MG-PCG等多种经典求解方法作对比,证明了其在流体大型线性方程组的快速求解中所具有的巨大优势。该方法还考虑了深度神经网络模型预测结果的不可压缩性性质、液体模拟中的自由边界等特殊问题,提出了相应的模型损失函数、特殊自由边界网络等模块,对该泊松方程快速求解算法效果进行了进一步提升。·提出了一种新的基于深度卷积神经网络(CNN)的低分辨率流体形态矫正算法。我们首先从欧拉网格法流体模拟在不同分辨率下所产生的流体结果形态偏差问题入手,设计了新的深度神经网络模型对低分辨率流体模拟结果进行速度和密度量的矫正,有效地减少了高-低分辨率模拟结果之间的物理形态差异。传统的形态矫正算法,如流体引导方法等,主要以高分辨率模拟结果为出发点,实现以低分辨率模拟结果为参考的数据矫正目标,而本文从另一个方面入手,以高分辨率模拟结果降采样数据为参考,以深度卷积神经网络模型为建模依据,通过学习相同场景下低分辨率与高分辨率速度场、密度场数据之间的差异,对低分辨率模拟结果的物理形态加以修正处理,使得低分辨率模拟结果与相应高分辨率结果相一致,实现了在低分辨率情况下可以快速预览高分辨率模拟结果的目标。在该算法的具体实现过程中,我们提出了基于网络层(Grid-layer)的特征向量构建方法,设计了相应的训练数据生成系统,同时还构建了基于预测密度差、速度差以及预测散度控制项的特殊损失函数。最后,通过耦合细节增强技术,我们在很大程度上提升了基于低分辨率模拟的细节合成结果的物理视觉效果,加速了高精度流体动画生成过程。·提出了一种新的基于相空间(Phase Space)的流体系统分析方法。目前,大多数流体模拟算法均无法避免流体变量在欧式空间中存在数据高维性所带来的计算困难,从而无法更为有效地分析流体等非线性运动现象的本质与特征。本文尝试站在一个全新的空间角度,将流体等非线性物理系统变量映射到具有低维流形特性的相空间中,并将相关问题转化为典型的几何问题来处理。同时,我们还结合了几何空间中的经典深度学习算法,如Point Net深度神经网络框架,基于流体相空间几何低维流形,进行了一系列拓展性应用探究。其中,我们对单摆、双摆、流体系统在相应相空间中的几何流形特性进行了分析,给出了不同基底所构成的不同相空间的性质。对于单摆、双摆系统,我们完成了例如分类与识别的拓展应用,对于流体系统,我们引入了应变张量(Strain Tensor)和旋转张量(Rotate Tensor)作为基底进行相空间构建,并进一步完成了基于此空间中的流体识别问题。
赵凯鹏[10](2019)在《基于MPI的地震波场有限差分数值模拟研究》文中指出地震波数值模拟作为勘探地震学领域中的一项关键技术,贯穿于地震数据的设计、采集、处理和解释之中。有限差分法精度易于提高、容易实现等特性使得它成为了模拟地震波的不二选择。现有的有限差分模拟方案已经能够满足常规的勘探要求,但随着行业的发展,不仅要获得高精度的数据,同时要高效率完成勘探任务。传统串行的方式即使采用工作站和集群依旧不能达到理想的效果,因此在地震波数值模拟中采用并行计算方案非常必要。本文以Foster并行算法设计流程为基础开展研究,实现了基于MPI(message passing interface)的并行地震波有限差分数值模拟。为实现在地震波模拟的并行化设计,本文从以下几个方面进行讨论:首先,论文对地震波波动方程进行了研究和推导。从弹性波动力学理论出发对声波、弹性波、SH波的波动方程进行了详细推导,同时探讨了品质因子在粘弹介质中的作用,并基于Kelvin模型和标准线弹性固体SLS模型推导了三种地震波在粘弹介质中的波动方程。通过普通网格和交错网格的差分精度对比,验证了交错网格的优点。同时推导出了高阶差分系数,并对地震波波动方程进行了离散表示。其次,对于并行有限差分模拟地震波中的一些关键技术进行讨论:数值频散的产生以及如何压制、差分公式稳定性的判定方法以及如何实现震源的加载方案以及不同子波的差异、吸收边界的重要性以及实现方法、并行中的重要过程:区域分解、坐标转换、区域通信、波场合并等的具体实现过程。最后,通过层状模型、断层模型、盐丘模型的地震波场模拟,比较并讨论了CPU数目与模拟效率的关系,以及不同介质模型中声波、弹性波、SH波的传播规律。通过弹性模型和粘弹模型的单道记录对比,分析了品质因子对地震波的影响。模拟结果表明,并行有限差分地震波模拟结合了高阶交错网格有限差分的优点,可以大大提高计算效率。但并行中CPU的数目与计算规模及计算机系统有关,需要合理选择;品质因子对地震波振幅及相位的影响较大,且并行计算中SLS粘弹模型的计算花费和加速比优于Kelvin粘弹模型,在实际数据处理中建议采用SLS粘弹模型。
二、基于交错网格的高效离散格式(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、基于交错网格的高效离散格式(论文提纲范文)
(1)高精度有限差分法波动方程正演及逆时偏移研究(论文提纲范文)
摘要 |
Abstract |
第1章 引言 |
1.1 选题依据及研究意义 |
1.2 国内外研究现状 |
1.2.1 波动方程正演及相关理论 |
1.2.2 有限差分数值频散压制方法 |
1.2.3 逆时偏移 |
1.3 论文研究内容与主要创新点 |
第2章 地震波场导数的有限差分法数值求解 |
2.1 概述 |
2.2 地震波场时间导数的高阶差分近似 |
2.3 地震波场空间导数的显式高阶差分近似 |
2.3.1 规则网格任意偶数阶精度显式有限差分系数计算 |
2.3.2 交错网格任意偶数阶精度显式有限差分系数计算 |
2.3.3 差分精度分析 |
2.4 地震波场空间导数的隐式高阶差分近似 |
2.4.1 规则网格任意偶数阶精度隐式有限差分系数计算 |
2.4.2 交错网格任意偶数阶精度隐式有限差分系数计算 |
2.4.3 差分精度分析 |
2.5 小结 |
第3章 时域有限差分法波动方程正演模拟 |
3.1 概述 |
3.2 声波方程有限差分法 |
3.2.1 声波方程及其有限差分格式构建 |
3.2.2 数值频散分析 |
3.2.3 稳定性讨论 |
3.2.4 边界条件 |
3.2.5 模型正演测试 |
3.3 弹性波方程有限差分法 |
3.3.1 弹性波方程及其有限差分格式构建 |
3.3.2 震源加载实现 |
3.3.3 数值频散和稳定性分析 |
3.3.4 模型正演测试 |
3.4 双相介质波动方程有限差分法 |
3.4.1 双相介质波动方程及其有限差分格式构建 |
3.4.2 数值频散和稳定性分析 |
3.4.3 模型正演测试 |
3.5 小结 |
第4章 基于常系数优化法的有限差分波动方程正演模拟 |
4.1 概述 |
4.2 伪谱法简介 |
4.3 时间频散变换 |
4.4 基于采样近似方法优化空间导数的有限差分系数 |
4.4.1 采样近似法优化差分系数 |
4.4.2 结合泰勒展开和采样近似方法优化差分系数 |
4.5 基于不同范数求解空间导数的有限差分系数 |
4.5.1 基于最大范数求解空间导数的有限差分系数 |
4.5.2 基于二范数求解空间导数的有限差分系数 |
4.5.3 基于最小范数求解空间导数的有限差分系数 |
4.6 基于Remez算法求解空间导数的有限差分系数 |
4.6.1 Remez算法优化差分系数简介 |
4.6.2 利用相对误差建立目标函数优化差分系数 |
4.6.3 与其它优化算法的差分精度对比分析 |
4.7 数值频散和稳定性分析 |
4.7.1 数值频散对比 |
4.7.2 算子长度自适应策略 |
4.7.3 稳定性讨论 |
4.8 模型正演测试 |
4.8.1 声波方程数值模拟实例 |
4.8.2 弹性波方程数值模拟实例 |
4.8.3 双相介质波动方程数值模拟实例 |
4.9 小结 |
第5章 基于高精度有限差分数值模拟方案的逆时偏移技术 |
5.1 概述 |
5.2 逆时偏移基本原理 |
5.3 成像条件 |
5.3.1 激发时刻成像条件 |
5.3.2 上下行波振幅比成像条件 |
5.3.3 互相关成像条件 |
5.4 逆时偏移噪音压制 |
5.4.1 成像噪声的产生机制 |
5.4.2 去噪方法 |
5.5 声波方程叠前逆时偏移 |
5.5.1 水平层状模型逆时偏移成像 |
5.5.2 盐丘模型逆时偏移成像 |
5.5.3 Marmousi-2模型断层部分逆时偏移成像 |
5.6 小结 |
结论 |
致谢 |
参考文献 |
攻读学位期间取得学术成果 |
附录 |
A一阶应力-速度声波方程组的时间高阶差分离散化 |
B一阶空间导数的隐式交错网格有限差分求解方法 |
C Biot双相介质一阶速度-应力方程的矩阵表达式 |
(2)破裂动力学的曲线网格有限差分方法研究及高性能计算(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 破裂动力学数值模拟的意义 |
1.2 破裂动力学数值模拟进展 |
1.2.1 断层摩擦本构关系的发展 |
1.2.2 破裂动力学数值方法的发展 |
1.2.3 破裂动力学的高性能计算进展 |
1.3 本文研究的目的与内容 |
第2章 破裂动力学数值方法及改进 |
2.1 破裂动力学数值求解思路 |
2.1.1 弹性动力学方程 |
2.1.2 摩擦准则 |
2.2 曲线坐标系 |
2.3 波场传播数值方法 |
2.3.1 空间差分算子 |
2.3.2 时间积分格式 |
2.3.3 自由表面处理 |
2.4 断层边界处理 |
2.4.1 速度更新 |
2.4.2 应力更新 |
2.5 方法改进 |
2.5.1 断层牵引力求解的改进 |
2.5.2 速度空间导数求解的改进 |
2.5.3 数值验证 |
2.6 本章小结 |
第3章 速率状态准则控制下的破裂动力学模拟 |
3.1 速率状态准则基本理论 |
3.2 速率状态准则数值方法 |
3.2.1 无量纲的状态变量 |
3.2.2 正则化处理 |
3.2.3 断层牵引力求解 |
3.2.4 牛顿法求解断层滑动速率 |
3.3 高速破裂时热效应的考虑 |
3.3.1 骤热效应 |
3.3.2 热增压效应 |
3.3.3 热增压过程的数值处理 |
3.4 数值验证 |
3.4.1 慢度准则模型TPV102 |
3.4.2 滑动准则模型TPV104 |
3.4.3 热增压模型TPV105-3D |
3.4.4 粗糙断层 |
3.5 本章小结 |
第4章 动力学破裂模拟的GPU加速 |
4.1 破裂动力学程序GPU加速的必要性 |
4.2 CUDA实现及优化 |
4.2.1 CUDA架构及编程考虑 |
4.2.2 程序流程图 |
4.2.3 高带宽的关键:Volta架构的L1数据缓存 |
4.3 正确性验证 |
4.3.1 倾斜断层 |
4.3.2 粗糙断层 |
4.4 性能分析 |
4.4.1 加速比 |
4.4.2 有效带宽 |
4.5 本章小结 |
第5章 基于神威众核架构的超大规模波场传播模拟 |
5.1 神威·太湖之光超级计算机 |
5.2 复杂沉积盆地下大地震的模拟 |
5.3 模型构建与方法 |
5.3.1 介质模型 |
5.3.2 动力学破裂震源 |
5.3.3 强地面运动 |
5.4 结果分析 |
5.4.1 地震图 |
5.4.2 反应谱 |
5.4.3 强地面运动峰值 |
5.5 本章小结 |
第6章 结论与展望 |
6.1 结论 |
6.2 展望 |
参考文献 |
附录A 系数矩阵 |
致谢 |
在读期间发表的学术论文与取得的研究成果 |
(3)面向复杂地形地震模拟的并行优化方法研究(论文提纲范文)
摘要 |
abstract |
第1章 绪论 |
1.1 高性能计算机发展概述 |
1.2 地震模拟发展概述 |
1.3 本文主要内容与结构 |
第2章 研究现状分析 |
2.1 基于通用超级计算机的大规模地震模拟研究现状分析 |
2.1.1 基于谱元法的大规模地震模拟 |
2.1.2 基于隐式有限元方法的大规模地震模拟 |
2.1.3 基于间断有限元方法的大规模地震模拟 |
2.1.4 基于有限差分方法的大规模地震模拟 |
2.1.5 与已有工作的比较 |
2.2 基于可重构计算平台的研究现状分析 |
2.2.1 基于可重构计算平台的软硬件协同计算 |
2.2.2 基于可重构计算平台的混合精度分析与优化 |
2.2.3 基于可重构计算平台的地震模拟 |
2.3 本章小结 |
第3章 面向大规模并行异构系统的复杂地形地震模拟算法 |
3.1 面向复杂地形的地震模拟算法 |
3.1.1 波动方程介绍 |
3.1.2 适用于复杂地形起伏区域的地震模拟算法 |
3.1.3 有限差分数值方法 |
3.2 适用于大规模并行异构系统的算法重新设计 |
3.3 多级网格划分方案 |
3.4 进程间网络通信优化 |
3.5 IO通信优化 |
3.6 本章小结 |
第4章 面向“神威·太湖之光”的复杂地形地震模拟并行优化方法 |
4.1 国产众核架构SW26010 处理器 |
4.1.1 SW26010 处理器硬件架构 |
4.1.2 SW26010 内存体系 |
4.1.3 SW26010 处理器编程模型及面临的挑战 |
4.2 内存利用率优化 |
4.2.1 面向二维有限差分的内存利用率优化 |
4.2.2 面向三维有限差分的内存利用率优化 |
4.3 内存带宽优化 |
4.3.1 变量融合方法 |
4.3.2 网格点重排列 |
4.3.3 协作存取模型 |
4.4 向量化策略 |
4.4.1 传统的向量化策略 |
4.4.2 混合型向量化策略 |
4.5 本章小结 |
第5章 基于可重构计算平台的地震模拟混合精度并行优化方法 |
5.1 可重构计算平台 |
5.1.1 可编程逻辑门阵列 |
5.1.2 数据流编程模型 |
5.2 地震模拟定点化方法 |
5.2.1 基于单变量的浮点数定点化 |
5.2.2 基于多变量的浮点数定点化 |
5.2.3 基于地震模拟算法的动态定点化方法 |
5.3 范围分析和精度分析 |
5.3.1 分析平台与案例 |
5.3.2 基于单时间步的范围分析 |
5.3.3 基于多时间步的范围分析 |
5.3.4 精度分析 |
5.4 基于混合精度的动态定点化地震模拟数据流处理器设计与验证 |
5.4.1 数据流处理器设计 |
5.4.2 面向资源的优化策略 |
5.4.3 基于理想模型的系统设计验证 |
5.5 本章小结 |
第6章 性能测试及模拟结果分析 |
6.1 背景介绍 |
6.2 基于“神威?太湖之光”的汶川地震模拟 |
6.2.1 完整的大规模地震模拟系统 |
6.2.2 性能分析与扩展性 |
6.3 基于可重构计算平台的汶川地震模拟 |
6.3.1 适用于地震模拟算法的CPU-FPGA异构系统设计 |
6.3.2 系统设计正确性验证 |
6.3.3 系统性能和功耗分析 |
6.4 大规模汶川地震模拟结果分析 |
6.4.1 地形效应有效性验证 |
6.4.2 基于反演震源的汶川地震模拟 |
6.4.3 基于模拟震源的汶川地震模拟 |
6.5 本章小结 |
第7章 总结与展望 |
7.1 论文工作总结 |
7.2 未来展望 |
参考文献 |
致谢 |
个人简历、在学期间发表的学术论文与研究成果 |
(4)求解Helmholtz方程的非紧致优化四阶有限差分法(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究意义 |
1.2 国内外研究现状 |
1.3 本文的结构安排及主要工作 |
第二章 非紧致高阶有限差分方案 |
2.1 离散高阶项△u |
2.2 零阶导数项k~2u离散 |
2.3 局部截断误差分析 |
第三章 频散分析及权参数确定 |
3.1 频散分析 |
3.2 权重参数求解 |
3.3 归一化相速度曲线 |
第四章 C25p方案的匹配界面和边界方法 |
4.1 引言 |
4.2 中心FD方法的MIB方法 |
4.3 C25p方案的延拓MIB方法 |
第五章 C25p方案的数值实验及结论与展望 |
5.1 关于具有Dirichlet边界条件的Helmholtz方程的数值实验 |
5.2 关于具有Robin边界条件的Helmholtz方程的数值实验 |
5.3 关于具有混合边界条件的Helmholtz方程的数值实验 |
5.4 采用四阶中心差分与C25P方案的数值对比实验 |
5.5 结论 |
5.6 展望 |
参考文献 |
攻读硕士学位期间的科研成果 |
致谢 |
(5)基于异构众核处理器的有限差分算法并行优化(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景 |
1.1.1 研究背景与意义 |
1.1.2 并行计算 |
1.1.3 机遇与挑战 |
1.2 有限差分算法研究现状 |
1.3 相关工作 |
1.4 研究内容与组织结构 |
1.4.1 研究内容 |
1.4.2 组织结构 |
第二章 “神威·太湖之光”超级计算机系统 |
2.1 “神威·太湖之光”超级计算机系统简介 |
2.2 申威26010国产异构众核处理器 |
2.2.1 申威26010处理器主核架构 |
2.2.2 申威26010处理器从核架构 |
2.3 并行工具简介 |
2.3.1 异构并行模式 |
2.3.2 并行编写规则 |
2.4 本章小结 |
第三章 有限差分方法 |
3.1 有限差分方法简介 |
3.2 常规有限差分网格建立 |
3.2.1 有限差分格式 |
3.2.2 均匀介中常规网格有限差分 |
3.2.3 高阶差分系数推导 |
3.2.4 有限差分交错网格 |
3.3 波动方程常规网格有限差分 |
3.3.1 均匀介中质差分形式 |
3.3.2 速度-应力波动方程 |
3.4 Stencil |
3.5 本章小结 |
第四章 基于众核处理器的三维地震声波正演模拟 |
4.1 三维地震波正演模拟 |
4.1.1 地震波场模拟概述 |
4.2 地震反演成像 |
4.3 并行方案与优化策略 |
4.3.1 数据划分策略 |
4.3.2 一级并行优化策略 |
4.3.3 二级并行优化策略 |
4.4 优化结果与性能分析 |
4.4.1 正演正确性验证 |
4.4.2 反演成像效果 |
4.4.3 多级并行性能测试 |
4.4.4 性能比较 |
4.4.5 扩展性能测试 |
4.5 本章小结 |
第五章 基于综合处理器通用地球系统模式中有限差分法的并行优化 |
5.1 多级异构并行策略 |
5.1.1 并行优化策略 |
5.1.2 一级并行优化策略 |
5.1.3 二级并行优化策略 |
5.1.4 向量化并行 |
5.2 优化结果及其性能分析 |
5.2.1 并行性能测试 |
5.2.2 扩展性能测试 |
5.3 本章小结 |
主要结论与展望 |
主要结论 |
展望 |
致谢 |
参考文献 |
附录 :作者在攻读硕士学位期间发表的论文 |
(6)龙格-库塔法数值求解基于有限体积的不可压Navier-Stokes方程和流固耦合问题(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 引言 |
1.2 N-S方程空间离散研究现状 |
1.3 N-S方程时域求解研究现状 |
1.4 动网格和流固耦合问题研究现状 |
1.5 湍流模拟研究现状 |
1.6 本文研究内容 |
第2章 不可压N-S方程的空间离散 |
2.1 动量守恒方程和连续性方程的空间离散 |
2.2 网格法向移动速度的计算 |
2.3 非交错网格上的动量插值 |
2.3.1 传统基于离散动量方程的插值 |
2.3.2 基于半离散动量方程的插值 |
2.3.3 动量插值格式的空间收敛性 |
2.4 流固耦合问题 |
2.5 本章小节 |
第3章 隐式龙格-库塔法求解静网格上的不可压N-S方程 |
3.1 微分代数问题中的传统隐式龙格-库塔法 |
3.2 隐式龙格-库塔法的收敛性和阶次条件 |
3.3 一种新隐式龙格-库塔方法 |
3.4 龙格-库塔内部阶段速度的边界条件 |
3.5 对角隐式龙格-库塔法的低内存实现 |
3.6 本章小节 |
第4章 分离式龙格-库塔法求解动网格上的不可压N-S方程 |
4.1 分离式龙格-库塔法的一般格式 |
4.2 分离式龙格-库塔法的收敛性 |
4.3 分离式龙格-库塔法的阶次条件 |
4.4 本章小节 |
第5章 龙格-库塔内部阶段离散不可压N-S方程的求解 |
5.1 静止网格上的离散不可压N-S方程 |
5.2 运动网格上的离散不可压N-S方程 |
5.3 两相流固耦合问题的离散方程 |
5.4 本章小节 |
第6章 数值试验 |
6.1 泰勒-格林漩涡 |
6.1.1 空间精度验证 |
6.1.2 时间精度验证 |
6.2 振动圆柱的绕流 |
6.2.1 雷诺数33强迫振动圆柱 |
6.2.2 雷诺数100自由振动圆柱 |
6.2.3 雷诺数3000~10000自由振动圆柱的大涡模拟 |
6.3 理想平板上的气动力 |
6.4 本章小节 |
第7章 结论 |
7.1 空间离散方法 |
7.2 时间离散方法 |
7.3 数值算例的验证 |
7.4 方法的限制和未来工作的展望 |
致谢 |
参考文献 |
符号列表 |
攻读博士学位期间发表的论文及科研成果 |
(7)间断有限元方法和随机偏微分方程的缩减基方法的研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 引言 |
1.2 DG方法的国内外发展现状 |
1.2.1 交错网格上的中心DG方法 |
1.2.2 能量守恒的DG方法 |
1.2.3 熵稳定的DG方法 |
1.2.4 保磁场散度为零的DG方法 |
1.2.5 时间离散方法 |
1.3 自由分布的随机分析 |
1.4 缩减基方法 |
1.5 常用记号 |
1.6 本文的主要内容 |
第2章 交错网格上中心DG方法的最优误差估计 |
2.1 引言 |
2.2 一维交错网格上中心DG方法 |
2.3 高维交错网格上中心DG方法 |
2.4 数值算例 |
2.5 本章小结 |
第3章 二维双曲方程笛卡尔网格上的DG方法 |
3.1 引言 |
3.2 线性常系数方程 |
3.2.1 最优误差估计的结果 |
3.2.2 最优误差估计的证明 |
3.3 线性变系数方程 |
3.3.1 最优误差估计的结果 |
3.3.2 最优误差估计的证明 |
3.4 非线性方程 |
3.4.1 最优误差估计的结果 |
3.4.2 最优误差估计的证明 |
3.5 数值算例 |
3.6 本章小结 |
第4章 能量守恒DG方法的超收敛性 |
4.1 引言 |
4.2 能量守恒DG格式 |
4.3 格式的超收敛性 |
4.3.1 插值函数的超收敛性 |
4.3.2 数值流通量和单元平均的超收敛性 |
4.3.3 特殊点的超收敛性 |
4.4 数值算例 |
4.5 本章小结 |
第5章 理想MHD方程的熵稳定DG方法 |
5.1 引言 |
5.2 理想MHD方程 |
5.2.1 理想MHD的熵函数 |
5.3 熵稳定的高阶DG格式 |
5.3.1 Gauss-Lobatto积分及分部求和 |
5.4 数值算例 |
5.4.1 一维黎曼问题 |
5.4.2 扭转Alfven脉冲波 |
5.4.3 Orszag-Tang涡问题 |
5.4.4 转子测试 |
5.4.5 光滑Alfven波 |
5.4.6 旋转的激波管问题 |
5.5 本章小结 |
第6章 柱坐标下理想MHD方程局部散度为零的谱-DG方法 |
6.1 引言 |
6.2 柱坐标下的MHD方程 |
6.3 数值方法 |
6.3.1 谱-DG格式 |
6.3.2 散度为零限制 |
6.4 数值算例 |
6.5 本章小结 |
第7章 无离线阶段的RBM方法 |
7.1 引言 |
7.2 随机偏微分方程模型 |
7.3 COFRB算法 |
7.3.1 SODE问题 |
7.3.2 SPDE问题 |
7.4 COFRB算法的复杂度分析 |
7.4.1 COFRB_ODE的计算复杂度 |
7.4.2 COFRB_PDE的计算复杂度 |
7.5 数值算例 |
7.6 本章小结 |
第8章 总结和展望 |
8.1 总结 |
8.2 展望 |
参考文献 |
部分引理和命题的证明 |
A.1 第2章引理和命题的证明 |
A.1.1 引理2.3的证明 |
A.1.2 命题2.4的证明 |
A.1.3 引理2.7的证明 |
A.1.4 引理2.8的证明 |
A.2 第3章引理和命题的证明 |
A.2.1 引理3.3的证明 |
A.2.2 引理3.4的证明 |
A.2.3 命题3.5的证明 |
A.2.4 引理3.8的证明 |
A.2.5 命题3.10的证明 |
A.3 第4章引理和命题的证明 |
A.3.1 引理4.2的证明 |
A.3.2 定理4.4的证明 |
A.3.3 定理4.6的证明 |
A.3.4 定理4.7的证明 |
算法的实现细节 |
A.4 算法2的实现 |
A.4.1 步骤5 |
A.4.2 步骤6 |
A.4.3 步骤10 |
A.5 算法3的实现 |
致谢 |
在读期间发表的学术论文与取得的研究成果 |
(8)高性能界面两相流数值模拟方法的构建及性能分析(论文提纲范文)
学位论文数据集 |
摘要 |
abstract |
符号说明 |
第一章 绪论 |
1.1 研究的背景和意义 |
1.2 国内外相关研究进展 |
1.2.1 界面捕捉方法研究进展 |
1.2.2 速度压力耦合方法研究进展 |
1.2.3 代数方程组求解方法研究进展 |
1.3 本文的主要内容 |
第二章 同位网格VOSET+SIMPLE方法的构建及性能分析 |
2.1 同位网格VOSET+SIMPLE方法 |
2.1.1 控制方程 |
2.1.2 VOSET+SIMPLE方法 |
2.1.3 VOSET方法的实施 |
2.1.4 SIMPLE算法的实施 |
2.2 计算条件和收敛标准 |
2.3 算例比较及结果分析 |
2.3.1 算例1:垂直液柱溃坝问题 |
2.3.2 算例2:单气泡上升问题 |
2.3.3 算例3:多气泡上升问题 |
2.4 本章小结 |
第三章 同位网格VOSET+IDEAL方法的构建及性能分析 |
3.1 同位网格VOSET+IDEAL方法 |
3.2 算例比较及结果分析 |
3.2.1 算例1:垂直液柱溃坝问题 |
3.2.2 算例2:单气泡上升问题 |
3.2.3 算例3:多气泡上升问题 |
3.3 本章小结 |
第四章 代数方程组求解效率对同位网格VOSET+IDEAL方法求解性能的影响 |
4.1 代数方程组求解方法 |
4.1.1 G-S点迭代 |
4.1.2 交替方向隐式方法(ADI) |
4.1.3 强隐迭代方法(SIP) |
4.1.4 共轭梯度方法(Bi-CGSTAB) |
4.1.5 结合块修正技术的双共轭梯度方法(BCT-Bi-CGSTAB) |
4.2 算例比较及结果分析 |
4.2.1 算例1:垂直液柱溃坝问题 |
4.2.2 算例2:单气泡上升问题 |
4.2.3 算例3:多气泡上升问题 |
4.3 本章小结 |
第五章 结合多重网格法的高效界面两相流模拟方法的构建及性能分析 |
5.1 多重网格方法的基本构架 |
5.1.1 光顺和光顺算子 |
5.1.2 限定和限定算子 |
5.1.3 延拓和延拓算子 |
5.2 VOSET+IDEAL+多重网格(BCT-Bi-CGSTAB)方法 |
5.3 多重网格法实施中的注意事项 |
5.3.1 最粗层网格数的选取 |
5.3.2 光顺初场的设置 |
5.3.3 各层网格光顺次数的选取 |
5.4 计算条件及收敛标准 |
5.5 算例比较及结果分析 |
5.5.1 算例1:单气泡上升问题 |
5.5.2 算例2:多气泡上升问题 |
5.6 本章小结 |
第六章 结论与展望 |
6.1 结论 |
6.2 展望 |
参考文献 |
致谢 |
研究成果及发表的学术论文 |
作者和导师简介 |
附件 |
(9)基于深度神经网络的流体动画研究(论文提纲范文)
摘要 |
ABSTRACT |
主要符号对照表 |
第一章 绪论 |
1.1 研究背景与意义 |
1.2 研究领域内的热点与难点 |
1.3 本文研究的框架与具体内容 |
1.3.1 本文研究的整体框架 |
1.3.2 本文研究的具体内容 |
1.4 论文组织 |
第二章 流体模拟基本数学框架与相关工作 |
2.1 流体动画模拟的数学基础与离散方法 |
2.1.1 流体动画模拟的数学基础 |
2.1.2 离散化方法——均匀网格与交错网格 |
2.2 基于物理的流体动画传统模拟方法与分析 |
2.2.1 流体方程求解的数值方法——共轭梯度法 |
2.2.2 投影步加速方法 |
2.2.3 复合网格格式方法 |
2.2.4 降维计算方法 |
2.2.5 细节合成方法 |
2.2.6 形态引导方法 |
2.3 基于数据驱动的流体动画模拟方法与分析 |
2.3.1 基于数据的插值方法 |
2.3.2 基于数据的预计算方法 |
2.3.3 基于数据的机器学习方法——深度学习与神经网络 |
2.4 本章小结 |
第三章 基于深度神经网络的流体投影步加速及其自适应增量学习方法 |
3.1 引言 |
3.2 基于深度神经网络的流体模拟投影步加速方法 |
3.2.1 基于深度神经网络的流体模拟投影步加速算法框架 |
3.2.2 实验结果与不足 |
3.3 基于深度增量学习的自适应流体模拟加速方法 |
3.3.1 自适应增量学习算法框架与流程 |
3.3.2 实验结果与性能分析 |
3.4 本章小结与讨论 |
第四章 基于深度卷积神经网络的Poisson方程求解算法 |
4.1 引言 |
4.1.1 Poisson方程与大型线性方程组 |
4.1.2 线性方程组的数值求解方法 |
4.2 基于深度卷积神经网络的Poisson方程求解算法 |
4.2.1 基于深度卷积神经网络的Poisson方程求解算法框架 |
4.2.2 基于全局网格信息的特征矩阵与特征向量 |
4.2.3 训练样本与数据处理 |
4.2.4 深度卷积神经网络模型 |
4.2.5 模型损失函数设计 |
4.3 实验结果与性能分析 |
4.3.1 烟雾模拟测试结果 |
4.3.2 液体模拟测试结果 |
4.3.3 算法性能分析 |
4.4 本章小结与讨论 |
第五章 基于深度卷积神经网络的低分辨率流体形态矫正 |
5.1 引言 |
5.1.1 高-低分辨率流体模拟结果的形态差 |
5.1.2 流体形态相关的传统算法 |
5.2 基于深度卷积神经网络的低分辨率流体形态矫正算法 |
5.2.1 基于深度卷积神经网络的低分辨率流体形态矫正算法框架 |
5.2.2 深度学习模型的特征输入与输出张量 |
5.2.3 训练数据与样本处理 |
5.2.4 深度卷积神经网络模型 |
5.2.5 模型损失函数设计 |
5.3 实验结果与性能分析 |
5.3.1 流体模拟测试 |
5.3.2 算法性能分析 |
5.4 本章小结与讨论 |
第六章 基于相空间的流体动画研究 |
6.1 引言 |
6.2 相空间 |
6.2.1 相空间中的非线性物理系统 |
6.2.2 流体相空间及其低维流形 |
6.3 基于相空间的流体动画深度学习方法与应用 |
6.3.1 相空间流体的基底研究与分析 |
6.3.2 训练数据与样本生成 |
6.3.3 深度学习框架与网络模型 |
6.3.4 实验结果与性能分析 |
6.4 本章小结与讨论 |
第七章 结语 |
7.1 全文总结与讨论 |
7.2 未来工作 |
参考文献 |
致谢 |
攻读学位期间发表的学术论文 |
攻读学位期间参与的项目 |
攻读学位期间申请的专利 |
(10)基于MPI的地震波场有限差分数值模拟研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究目的和意义 |
1.2 地震波并行数值模拟研究历史和现状 |
1.2.1 有限差分地震波模拟的研究历史和现状 |
1.2.2 边界条件的研究历史和现状 |
1.2.3 并行地震波模拟的研究历史和现状 |
1.3 论文主要研究内容 |
第二章 波动方程及有限差分原理基础 |
2.1 地震波波动方程 |
2.1.1 弹性波方程 |
2.1.2 声波方程 |
2.1.3 SH波方程 |
2.1.4 粘弹性波方程 |
2.1.5 粘声波方程 |
2.1.6 粘SH波方程 |
2.2 地震波有限差分模拟原理 |
2.2.1 弹性波方程有限差分格式 |
2.2.2 声波方程有限差分格式 |
2.2.3 SH波有限差分格式 |
2.3 并行原理 |
第三章 并行地震波模拟中的关键技术及解决方案 |
3.1 数值频散 |
3.2 稳定性判断 |
3.3 地震子波的选取和加载 |
3.4 边界条件处理 |
3.5 并行中的关键技术 |
3.5.1 并行环境初始化 |
3.5.2 区域分解 |
3.5.3 参数读入 |
3.5.4 坐标转换 |
3.5.5 计算波场 |
3.5.6 波场输出 |
第四章 模型测试及结果分析 |
4.1 简单层状模型 |
4.1.1 声波模拟 |
4.1.2 弹性波模拟 |
4.1.3 SH波模拟 |
4.2 断层模型 |
4.2.1 声波模拟 |
4.2.2 弹性波模拟 |
4.2.3 SH波模拟 |
4.3 盐丘模型 |
4.3.1 声波模拟 |
4.3.2 弹性波模拟 |
4.3.3 SH波模拟 |
第五章 结论 |
5.1 结论 |
5.2 下一步工作 |
参考文献 |
攻读硕士学位期间取得的研究成果 |
致谢 |
四、基于交错网格的高效离散格式(论文参考文献)
- [1]高精度有限差分法波动方程正演及逆时偏移研究[D]. 王文化. 成都理工大学, 2021
- [2]破裂动力学的曲线网格有限差分方法研究及高性能计算[D]. 张文强. 中国科学技术大学, 2020(01)
- [3]面向复杂地形地震模拟的并行优化方法研究[D]. 陈炳炜. 清华大学, 2020(01)
- [4]求解Helmholtz方程的非紧致优化四阶有限差分法[D]. 陈健军. 南宁师范大学, 2020(03)
- [5]基于异构众核处理器的有限差分算法并行优化[D]. 陈宏博. 江南大学, 2020(01)
- [6]龙格-库塔法数值求解基于有限体积的不可压Navier-Stokes方程和流固耦合问题[D]. 万嘉伟. 西南交通大学, 2020(06)
- [7]间断有限元方法和随机偏微分方程的缩减基方法的研究[D]. 刘勇. 中国科学技术大学, 2020(01)
- [8]高性能界面两相流数值模拟方法的构建及性能分析[D]. 齐亚强. 北京石油化工学院, 2019
- [9]基于深度神经网络的流体动画研究[D]. 肖祥云. 上海交通大学, 2019(06)
- [10]基于MPI的地震波场有限差分数值模拟研究[D]. 赵凯鹏. 长安大学, 2019(01)