一、綫性代数方程组迭代收斂充分条件的改进(论文文献综述)
李政[1](2017)在《精细油藏数值模拟中的高效求解器研究》文中提出随着复杂类型油藏(低渗、高含水、复杂岩性油藏等)开发的日益深入和提高采收率技术的推广使用,油藏数值模拟所依据的数学模型变得越来越复杂,同时油藏地质模型趋向精细化、网格复杂化、井数增加以及类型多样化等,这些因素导致渗流模型数值离散所形成的雅克比线性代数方程组的规模大、性态坏。在全隐式油藏数值模拟计算中,雅克比线性代数方程组的求解是一个主要瓶颈,其求解时间往往占据整个模拟计算时间的70%~80%,而且随着问题规模增大,该比重会进一步提高。设计高效的数值求解算法来提高雅克比线性代数方程组的求解速度是缩短数值模拟时间最有效的途径之一。另外当前计算机的硬件架构越来越异构化,利用众核处理器(如GPU、MIC)来协助CPU计算的解决方案在科学计算领域正释放巨大的能量,并掀起一股新的高性能异构并行计算浪潮。本文针对经典标准黑油模型,为其全隐式离散得到的雅克比线性代数方程组设计高效的串、并行求解算法。首先,针对黑油模型的强耦合雅克比离散代数方程组,我们分析几种常用解耦方法,如交错块分解解耦、拟隐压显饱解耦、隐压显饱解耦,并分别考察这几种方法的解耦效果以及对压力方程椭圆性的影响。我们发现:交错块分解解耦方法能很好地削弱压力变量和饱和度变量以及饱和度变量和饱和度变量之间的耦合关系,同时对雅克比矩阵的特征值有很好的聚集作用,但该方法破坏了压力方程的椭圆性,使压力方程求解难度增加;拟隐压显饱解耦和隐压显饱解耦方法借助IMPES方法的思想,通过代数方法得到一个椭圆性较好的压力方程,但该解耦方法只削弱了压力方程中压力变量与饱和度变量的耦合程度。针对上述三种解耦方法得到的压力方程,本文分别比较了经典AMG方法、VMB聚集AMG方法以及Pairwise聚集AMG方法的求解速度,并简单分析上述三种AMG方法在求解经不同解耦方法得到的压力方程时收敛速度差异大的原因。经上述分析,我们将隐压显饱解耦方法与经典CPR预条件子结合起来形成一类分裂型预条件子,并用Pairwise聚集AMG方法取代经典AMG方法来求解压力方程,此分裂型预条件子的求解速度较交错块分解解耦方法与经典CPR预条件子组成的分裂型预条件子快了近50%。其次,由于当前油藏模拟向精细化发展,雅克比矩阵规模突破千万量级且性态越趋病态,给雅克比线性代数方程组的求解带来了极大困难,研发针对精细油藏模拟带来的超大规模雅克比线性代数系统的高效、稳健求解算法是十分必要的。本文利用交错块分解解耦方法具有聚集雅克比矩阵特征值以及削弱物理变量间耦合关系的性质,基于辅助空间校正思想,提出了一种稳健、高效、节省内存的分裂型预条件子。该分裂型预条件子采用交错块分解解耦方法作为左预条件子,然后针对交错块分解方法解耦后的雅克比矩阵的性质,设计了一种多阶段辅助子空间右预条件子BASP:首先在饱和度子空间用块高斯赛德尔方法对饱和度方程进行一次近似求解,消除饱和度部分的高频误差部分;其次针对带强间断系数的椭圆型压力方程,我们采用AMG预条件Krylov方法来近似求解达到一定精度,消除由压力方程控制的低频误差;最后在全空间做一次块高斯赛德尔磨光。通过大量油田实例测试,该分裂型预条件子整体表现得十分高效及稳健。基于该预条件子的模拟器的求解速度比国际主流商业模拟器快2到3倍,且在台式工作站上成功模拟了千万网格规模的精细油藏模型。最后,本文基于CPU-GPU异构体系设计一种求解雅克比线性代数方程组的高效并行线性解法器。当前超级计算机的计算能力越来越强大,但体系结构日趋复杂,大多数采用多核、众核处理器、大型高速缓存、高带宽进程间通信结构和高速I/O功能的设计模式。如何构建现代化高性能应用软件来充分利用计算机的异构架构特点和资源是十分值得探索的。本文针对油藏模拟中的雅克比矩阵的结构特点,提出了一种适合GPU访存特点的BHYB的稀疏存储格式,基于该格式的SpMV的加速比最高达19倍,比世界著名的Nvidia公司研发的高效CuSparse软件包最快的HYB格式快30%;其次基于GPU的SIMT编程模拟,本文提出了一种双密集型并行策略,设计了一种并行度高、并行可扩展性好的BILU(l)方法,其中BILU(0)分解阶段和三角求解阶段的平均加速比分别达到6.27倍和9.46倍;最后结合计算机的异构特点以及AMG算法各部分的可并行度,设计了一种异构并行UA AMG方法,且该并行UA AMG方法没有损失串行UA AMG方法的收敛速度。通过整合上述并行模块,我们形成了一种基于CPU-GPU异构体系的并行BCPRP预条件子。数值试验表明该并行预条件子十分稳健,相比改进后的串行BCPRP预条件算法,该并行BCPRP预条件子在单GPU卡上的求解速度提高了 3.0倍左右。此外,基于"天河二号"超级计算机,我们研发了一套分布式并行求解算法,将模拟规模扩展到亿量级网格单元的同时,也极大提高了油藏模拟效率。该分布式并行求解器在千核以内都具有良好的可扩展性,但扩展到10,008个CPU物理核心后,分布式并行求解器的强可扩展性还不够理想,线性求解器算法还有待进一步优化。
袁光伟,杭旭登,盛志强,岳晶岩[2](2009)在《辐射扩散计算方法若干研究进展》文中指出辐射流体力学研究辐射的传输对流体运动的影响,并在此条件下研究流体的运动规律.实际应用问题中辐射流体力学所描述的是非常复杂的物理过程,数值模拟是主要的研究手段之一.模拟通常采用流体计算和辐射计算分裂求解的方法.讨论求解辐射扩散方程时迫切需要解决的一些计算方法问题,包括大变形网格上扩散计算格式与非线性迭代方法,并简要介绍部分研究进展.
杭旭登[3](2004)在《偏微分方程迭代并行解法与网格优化方法》文中指出科学计算对计算规模的要求是无止境的,随着计算机能力的飞速的发展,计算的规模已经从几千几万到百万甚至千万上亿的规模。算法也相应地由串行的算法发展到适合大规模并行计算机的并行算法。计算规模的扩大带来了许多新问题。首先,并行计算机的体系结构要求相应的算法能充分挖掘计算能力,促进了并行计算方法的研究;其次,大规模的数值模拟计算对于计算方法的稳定性和计算网格的品质提出了更高的要求,推动了算法的稳定性和流体计算中计算网格的优化研究。因此,本文的主要研究目标是针对偏微分方程大规模的数值模拟中出现的这些问题进行研究,提出解决的方法和进行理论分析。 现代并行计算面临许多问题。从并行机的体系结构来说,大规模分布式内存并行计算机(MPP,或PC Cluster)是发展的主导方向,其主要特征是采用消息传递进行不同处理机之间的通信。现代大规模并行计算面临的主要瓶颈是全局通信问题和同步问题。全局通信体现了整个问题的全局综合,这是种全局性无法避免,但可以通过别的途径使之达到相同的功能,比如通过迭代方法。在构造偏微分方程离散计算格式时,应尽可能考虑避免整体数据的强相关和无需全局通讯的具有高并行度的格式。研究突破代数的层面,从差分格式乃至偏微分方程,甚至物理问题的层面来提出新的算法。偏微分方程的差分格式是离散逼近的重要的一步,其并行性方面的研究最近二十年来得到广泛的重视和发展。但离散格式的构造和格式的代数求解没有充分地结合起来,这两者相结合的问题没有受到足够的重视。实际上,差分格式的成功和代数方程组的求解息息相关,只有把差分格式和方程组的迭代求解结合起来研究,才可能使代数方程组的一些比较有效的迭代方法发挥更大的作用,构造真正适合应用的差分格式。大规模科学计算的另外一个问题是对于高速流动的流体,当用Lagrange方法或ALE方法进行计算时,容易出现网格折叠的情况而中断计算,这是精密物理的大规模数值模拟中目前遇到的瓶颈问题之一。 针对以上的问题,本论文对偏微分方程的差分数值求解进行了讨论。针对在现代并行计算机条件下如何充分有效地利用大量的计算机资源,高效稳定地数值求解偏微分方程,进行了详细的讨论。本论文的特点是结合迭代算法研究差分格式和结合差分格式研究迭代算法,从而使两者有机地结合到一起,为更好的解决辐射流体热传导和粒子输运计算等问题,探索新的研究途径。对区域分解的并行算法进行了理论分析和数值试验比较研究,将这些方法应用于抛物型方程和中子输运方程,得到了一些有创新性的结果;对代数方程组的求解的红黑排序混合算法进行了详细的理论分析和数值试验,并将其应用于辐射流体力学计算和油藏模拟中,取得了满意的计算结果;结合并行差分格式对Krylov子空间方法提出了一种并行预条件技术,并对其谱性质进行了较深入的分析;对于流体计算网格的优化,提出了一种组合优化的方法,这种优化方法的计算量小,并且能优化凹网格的问题,同时能较好的保持优化过的网格的重心能匹配原来网格的重心,能比较有效的解决网格的优化问题。 全文的主要内容可以大致分为三个部分:并行差分方法,线性代数方程组的并行高效求解和姆格优化这花个部分既相互独立,同时又相互影响和相互促进。木文结构如下:首先是绪论,概括介绍了本文的研究背萦和主要内容;第一章、第二章、式的钩造技术,主要研究了迭代并行差分格式的稳定性和收敛性,第说章研究并行差分格以及结合迭代技术的迭代并行差分格式的构造和理论分析;第四章研究中子输运方程离散纵标方法的迭代并行差分格式:第五章讨论了红黑排序混合算法的收敛速度问题,以及该算法在实际工程计算中的应娜:第六章是墓于界荡预估和修正的并行预条件技术。第七章讨论了计算流体的A LE方法中的卿格重构和优化技术。本文的杰要f作如一F:口}给出DFF差分格式的一个2范数的严格的无条件稳定性的证明,并估计出稳定性的常数, 同时证明了用OFF差分格式构造的区域分解并行差分格式的稳定性的必要条件。阴对显式迭代并行差分格式证明了其对于模型问题的稳定性条件比纯显式差分格式放宽了 封仍以七。睁}从空间区域分解出发,综合考虑迭代算法和差分格式的相互关系,使得两者相互触合,取 长补辣,设计了高效的迭代并行差分格式,这些新构造的并行格式其有良好的性质,主要 表现在如下豹几个方面: 给一)差分格式豹稳定性非常好。 (二)差分格式有较高的精度。 (蕊)差分格式构造比较简单,对区域的剂分没有任何限制。 (洲)差分格式不需要全局通信,有很好的扩展性。 (五)便于对已有的程序进行改造。拼〕将构造抛物型方程并行差分格式的方法推广到中子输运方程,进行了数值试验。吓!对线性代数方程组的迭代算法,红黑排序混合算法,分析了其算法特性和算法的收敛加速 悄况。证明了红黑排序混合算法比自然排序的算法,!讨样用共辘梯度法和Jacob玄迭代方法 求解,混合算法收敛速度是自然排序的2倍;用GMRES算法,混合算法收敛速度是自然 排序算法的2到4倍。大金的数徽试验验证了理沦?
卞翔[4](2017)在《基于免组装技术的大型有限元和拓扑优化快速算法研究》文中研究表明随着有限元分析和拓扑优化技术在汽车工程领域中的应用逐渐增多,面对的计算规模逐渐增大,计算速度成为大规模有限元分析和拓扑优化的挑战之一。提高大型有限元分析的速度,有利于扩大有限元技术在工程问题中的适用范围,提高设计效率、降低设计成本。本文以迭代算法为基础,以减少内存占用为出发点,将总刚矩阵免组装技术与压缩技术、并行运算、体素模型改进并结合,形成一套完整的免组装有限元体系,提供快速的稀疏矩阵和向量乘积(sparse matrix-vector multiplication,SpMV)计算。围绕大型有限元静力学分析、模态分析、线性屈曲分析及拓扑优化的快速算法展开研究,形成了一套具有工程应用价值的免组装有限元软件和方法,达到了提高大型有限元分析和拓扑优化速度的目的,将其应用于汽车零部件的结构分析和优化设计中,能更高效地解决实际工程问题。主要的研究内容和成果如下:(1)建立了一种高效的免组装有限元体系,该体系建立在体素模型的基础上,利用单元一致性减少内存占用,使用Wilson非协调单元在不增加计算复杂度的同时提高体素模型计算精度;利用压缩处理提高迭代算法收敛性;利用免组装技术进行刚度矩阵免组装以及压缩矩阵免组装的运算,减少有限元求解中的内存占用,并提供在单元层面并行运算的基础;将网格结点分配给线程,避免了竞态条件,通过单元一致性减少内存访问,在图形处理器上实现高效地SpMV并行运算。运用该免组装有限元体系对共轭梯度法改进,形成免组装压缩共轭梯度法,实现快速的线性方程组求解,提高了大型静力学问题的计算速度。针对体素模型局部应力精度不足的问题,通过调整体素模型表面结点坐标,使网格贴合几何模型,只产生少量非一致的单元,将其作为模板单元计算和存储刚度矩阵,减少内存占用,得到基于非一致单元的免组装有限元法,提高了局部应力计算的精度。(2)提出一种免组装的压缩子空间瑞利-里兹共轭梯度法用于快速求解大型模态分析问题。该算法通过对子空间瑞利-里兹共轭梯度法进行压缩处理,提高算法收敛性;改进后,该算法最主要的运算是SpMV运算及线性方程组求解,可以利用免组装有限元体系高效地完成。本文给出了完整的算法流程,并使用C语言实现该算法,通过变速箱体模态分析的算例,与商用软件对比,证明了该算法对大型模态分析的有效性和快速性。(3)针对帕累托追踪拓扑优化法(Pareto-tracing Topology Optimization,PareTO)对有限元分析次数多的问题,使用免组装有限元进行PareTO拓扑优化,得到一种免组装三维PareTO算法,并使用C语言编程,实现快速的三维连续体拓扑优化。通过经典算例,验证了免组装三维PareTO法的有效性。通过建立多工况拓扑优化模型,并添加加工约束,使PareTO算法更适合工程应用,并对悬架控制臂进行多工况拓扑优化,通过与HyperWorks对比,证明了该算法的有效性和快速性。(4)提出了基于免组装有限元体系的快速线性屈曲分析算法。针对线性屈曲分析中应力刚度矩阵需要分别存储,无法有效使用单元一致性的问题,提出使用逆迭代算法进行广义特征值问题的求解,并通过免组装有限元快速求解逆迭代算法中的线性方程组,降低数值误差,提高算法收敛速度。使用C语言实现算法,通过算例与商用软件对比,证明此线性屈曲分析算法的正确性和快速性。(5)提出了一种快速的三维连续体屈曲拓扑优化方法。首先建立屈曲载荷最大化的拓扑优化模型,使用Matlab实现二维屈曲拓扑优化,对半解析屈曲灵敏度公式、伴随法屈曲灵敏度公式以及简化屈曲灵敏度公式进行算例验证,对比了不同灵敏度公式产生的优化结果以及计算时间。将提出的免组装三维屈曲分析算法应用到屈曲拓扑优化中,建立了以柔顺度最小化为目标,通过可变权重因子动态引入屈曲约束的拓扑优化模型。使用C语言实现快速三维连续体屈曲拓扑优化算法,并给出了汽车零部件的屈曲分析和拓扑优化算例。(6)使用C语言开发的免组装有限元三维拓扑优化程序对SUV车架进行整体拓扑优化概念设计。建立了具有百万级自由度的大型有限元模型,首先从整体弯曲工况和整体扭转工况这两个典型工况角度,分别进行了单目标拓扑优化,通过最优拓扑中的材料分布了解车架各部位对弯曲刚度和扭转刚度的影响程度。随后在弯扭组合工况下进行多工况拓扑优化,提高车架的整体综合刚度,为车架轻量化设计提供了一定的参考依据和理论基础。通过与商用软件HyperWorks的对比,证明了本文基于免组装有限元的拓扑优化方法在处理大型问题中的速度优势。
李丰[5](2018)在《基于GPU的矩阵计算并行加速方法研究》文中提出矩阵计算是许多科学计算与机器学习方法的核心组成部分,有效提升矩阵计算的性能对于开发高性能科学计算系统或大数据处理系统有着重要的意义。图形处理器(Graphic Processor Unit,GPU)是一种重要的并行计算设备,可以同时运行大量的线程,同时在浮点运算方面有着巨大的优势,因此已经成为了目前最常用的并行计算协处理器,也是实现高性能矩阵计算的重要计算平台。然而,基于GPU的矩阵计算并行加速还面临着一个挑战性问题:由于GPU的并行计算模型是单指令多数据的,而很多矩阵计算问题又不可避免地出现数据依赖问题,因此如何解决数据依赖条件下多数据的并行调度和计算问题是一个难点。本文围绕这个核心问题,分别针对科学计算和机器学习中的矩阵计算模型及算法设计问题展开研究,主要研究内容包括稠密矩阵计算的优化、对称正定线性方程组的求解问题和具有缺失值的矩阵分解问题。本文研究的主要工作如下:(1)针对稠密矩阵的计算优化问题,本文提出一套处理器的自适应选择与优化方案,可以把合适的矩阵计算分配给合适的处理器。本文通过并行分析和数学建模方法两个层次对向量内积、矩阵与向量乘法、向量三角线性方程组求解、矩阵与矩阵乘法、矩阵三角线性方程组求解等五个常用的稠密矩阵计算进行研究,结合CPU和GPU的硬件架构特点得出一套完整的处理器选择方案,最后在不同大小的向量和矩阵上对并行分析结论和数学模型分别进行验证。实验证明,本文给出的处理器选择方案可以有效选择合适的处理器。基于本文得到的处理器选择方案,可以用于开发自适应高性能的稠密矩阵计算程序。(2)针对稀疏对称正定线性方程组的求解问题,本文设计一种可以高效利用GPU的预处理方法——基于完全逆的矩阵块预处理方法。稀疏对称正定线性方程组的求解问题一般需要用到预处理共轭梯度法,而预处理共轭梯度法中最重要的问题就是选择一个合适的预处理方法。本文先分析现有预处理方法在GPU上实现存在的缺陷,再利用GPU适合批量稠密矩阵计算的特点设计一种预处理方法——基于完全逆的矩阵块预处理方法,给出基于完全逆的矩阵块预处理方法的GPU实现并通过数学模型对各种预处理方法在GPU上的性能进行分析,最后在不同元素分布的稀疏对称正定线性方程组上进行实验。实验证明,与其他预处理方法相比,基于完全逆的矩阵块预处理方法在提高预处理共轭梯度法的收敛效率的同时可以保证计算的稳定性。基于完全逆的矩阵块预处理方法是一种可靠稳定高效的预处理方法,是在无法预知方程组元素分布的情况下最合适的方法。(3)针对具有缺失值的矩阵分解中存在的计算资源浪费问题,本文设计一种新的并行任务分配方法,新的任务分配方法可以去除空白数据块对线程块的占用。具有缺失值的矩阵分解主要用于推荐系统,而目前已有的基于GPU的矩阵分解方法在用户数量与商品数量相差较大时,会造成大量的GPU线程处于无数据执行状态,进而导致效率低下。本文主要针对在用户数量与商品数量相差较大的情况下,分析已有矩阵分块方式的缺陷,设计一种新的矩阵分块方式以及配套的GPU任务分配方法,新的任务分配方法可以有效利用计算资源进而提高计算效率,最后在四个不同的数据集上进行实验验证。实验证明,新的并行任务分配方法比现有方法效率更高。基于本文提出的计算任务分配方法,可以高效利用GPU完成具有缺失值的矩阵分解问题的求解。(4)针对具有缺失值的矩阵分解中存在的计算资源分配不均衡问题,本文设计一种基于向量并行的实现方法,该方法可以充分利用向量计算内在的并行性。本文比较现有的随机梯度下降法与其它优化问题的梯度下降法在并行实现方式上的不同,仔细分析两种并行方式的性能差别,给出一种新的数据划分和并行实现方法,并分析新的并行实现方法如何解决计算资源分配不均衡问题,最后在四个不同的数据集上进行实验验证。实验证明,基于向量并行的实现方法可以提升并行计算效率。基于本文提出的向量并行的实现方法,可以减少前期的数据预处理计算量,同时,在相同计算资源的情况下可以更高效的利用GPU完成具有缺失值的矩阵分解问题的求解。
王昕炜[6](2019)在《非线性最优控制问题的保辛伪谱方法及其应用》文中提出实际工程中的最优控制问题面临强非线性、约束、时滞等复杂特性,难以使用解析法完成求解。在构造最优控制问题数值算法时,人们通常单纯地关心如何提高数值解对解析解的逼近程度,却并未对最优控制问题本身的数学结构加以利用。事实上,最优控制问题可以通过Pontryagin极大值原理导入Hamiltonian系统,而保辛方法可以高效、精确地求解Hamiltonian系统。此外,直接法中的伪谱法由于其良好的精度目前求解最优控制问题的最流行的数值方法。然而伪谱法本质上是一种通用的近似方式,不应仅被局限于直接法的构造当中。基于这样的现状,本文考虑利用伪谱法的优良数学特性,在间接法的框架下发展求解非线性最优控制问题的保辛伪谱算法。本论文的具体工作如下:1.针对一般性无约束非线性最优控制问题,提出了多区段的保辛伪谱算法。数值算例表明,相对于基于均匀Lagrange插值的保辛方法,本文方法在数值精度和计算效率方面均有明显的优势。此外,为避免为了提高数值解精度而盲目加密求解网格,基于状态变量曲线的相对曲率提出了一种自适应hp网格加密技术。2.针对含有不等式约束的非线性最优控制问题,结合序列拟凸化方法,提出了多区段的保辛伪谱算法。通过Lagrange乘子法,纯状态、纯控制以及状态-控制混合三类约束,得以在统一的框架下进行处理,并得到严格满足。通过数值算例表明,相较于经典伪谱法以及自适应hp伪谱法,本文方法在数值精度和计算效率方面具有明显的优势。3.针对含有状态时滞的非线性最优控制问题,结合序列拟凸化方法,提出了多区段的保辛伪谱算法,首次实现了对时滞最优控制问题的保辛求解。数值算例表明,相比于伪谱方法和同伦打靶方法,本方法在数值精度和计算效率方面均具有一定的优势。4.基于2中发展的保辛伪谱算法,结合滚动优化的思想,构造了可以考虑约束的保辛伪谱模型预测控制和保辛伪谱滚动时域估计算法,以服务于闭环控制的需要。分别通过桥式起重机轨迹跟踪问题和航天器的状态估计问题,验证了两类算法的有效性。本论文发展的这系列保辛伪谱算法具有丰富的收敛特性,通过调节子区间数目或伪谱近似阶数,可以分别使算法呈现线性和指数的收敛速度。由于该系列算法基于最小作用量原理构造,涉及的核心矩阵天然地具有稀疏、对称的特性,而且多区段的特性极易实现并行计算,为大规模非线性最优控制问题的高效、精确求解提供了潜在的可能。此外,针对实际的轨迹优化问题,离线的轨迹规划连同在线的轨迹跟踪和状态估计得以使用相同的保辛伪谱算法进行求解,为控制算法在硬件上的集成提供了极大的便利。
孔倩[7](2019)在《松弛迭代算法的加速方法研究》文中研究指明椭圆偏微分方程经常出现在数学、物理和工程等方面,为了求解由有限差分法离散椭圆偏微分方程之后得到的一系列线性代数方程组,许多迭代法的研究日趋活跃。投影法如基于Krylov子空间的共轭梯度法(CG)、广义最小残差法(GMRES)方法等需要有效的预处理子,在自适应网格上有限制性。因此通常考虑基本迭代法如Jacobi迭代法、Richardson方法、SOR迭代法等来求解方程组。由于Jacobi迭代法具有简单性和可大规模并行化的特点,近几年关于Jacobi迭代加速算法的研究层出不穷,这些研究主要从两个方面对Jacobi迭代进行加速。一是在Jacobi迭代法的变形算法中引入一些松弛参数对误差的相应部分进行控制,如已有的规划松弛雅可比迭代法(SRJ)、DOR迭代法等;二是在Jacobi迭代过程中加入Anderson算法,如Anderson雅可比迭代法(AJ)和交替Anderson雅可比迭代法(AAJ)等。在Jacobi迭代的加速变形算法基础上,本文以规划松弛雅可比迭代的加速算法为研究课题,重点研究算法的加速过程和收敛性,主要研究内容分为三部分。首先对已存在的四种主要的Jacobi加速算法进行介绍,包括加权雅可比迭代法、规划松弛雅可比迭代法、Anderson雅可比迭代法和交替Anderson雅可比迭代法。其次通过在SRJ的每一个迭代循环中分别加入Anderson加速法和最小残差法来构造两种新算法,形成交替Anderson规划松弛雅可比迭代法(AASRJ)和最小残差规划松弛雅可比迭代法(MRSRJ),并在文中给出相应的算法步骤。最后在Laplace模型问题、变系数问题和辐射扩散模型问题下进行数值实验,比较SRJ、AAJ、AASRJ、MRSRJ与最优的SRJ算法,即切比雪夫雅可比迭代法(CJ)求解相应问题时的收敛性能和计算时间,在求解大规模线性代数系统的过程中总结出AASRJ和MRSRJ的收敛性质,验证了AASRJ可与CJ相竞争的算法高效性,且AASRJ和MRSRJ在文中所考虑的所有情况下收敛效率也优于SRJ。两种算法的简单性和高效性使得它们都是求解大规模稀疏线性代数系统方程的优良迭代法。
陆开诚[8](2019)在《LAPW基组第一性原理计算的GPU加速方法及其应用》文中认为第一性原理计算在凝聚态物理学研究及新材料研发中具有重要作用,其中基于线性缀加平面波(LAPW)基组的第一性原理计算具有计算精度高、适用于对磁性材料、磁光材料模拟仿真的特点,已获得较为广泛的应用。然而由于以LAPW为波函数基组求解Kohn-Sham方程的自洽迭代过程较为复杂,其计算耗时长、计算体系规模小、需要用到价格昂贵的高性能计算机或计算集群,已成为制约相关研究与工程应用的瓶颈。图形处理器(Graphics Processing Unit,GPU)通用计算技术的出现为加速LAPW基组第一性原理计算提供了新的方向。GPU的浮点运算性能、并行能力和存储带宽都超过了同期的主流CPU,而NVIDIA公司的CUDA框架大大降低了研发人员利用GPU开发高性能计算程序的难度。本文提出了采用GPU来加速LAPW基组第一性原理计算的方法,并在该方法的基础上实现GPU加速计算程序。主要的研究工作如下:1.系统研究了 LAPW基函数计算及采用LAPW基组的第一性原理计算方法,并且对GPU通用计算的硬件架构和技术框架进行了研究。2.对LAPW方法的自洽迭代计算过程中涉及LAPW计算且计算量较大的三个关键模块进行研究,推导其数学模型及数值算法。3.在上述基础上,提出三个关键模块的GPU并行加速方法。通过核函数或线性代数库将三个关键模块的大部分计算移植到GPU上进行,并采用并行算法优化原过程,优化线程组织和内存使用策略以充分利用GPU上的计算及存储资源。4.基于CUDA框架实现了 GPU加速程序,并对加速计算程序进行测试。本文在CPU-GPU异构系统上对加速计算程序进行了实验测试,其结果表明:程序的计算结果准确可靠,并基于实验条件在不同计算精度和不同体系规模下分别达到最高为4.9倍和3.1倍的加速比。这意味着本文开发的GPU加速的LAPW基组第一性计算程序,能够在相同时间内完成更大规模的体系、或完成更高的精度的计算任务,同时具有较低的设备采购和使用成本,具有实际应用意义与应用价值。
刘溢浪[9](2018)在《非结构网格高阶数值格式与加速收敛方法研究》文中指出近年来,计算流体力学已经被广泛应用于飞行器设计之中,并发挥着越来越重要的作用。非结构网格生成简单,节点、单元分布可控性好,对复杂构型有天然的自适应性,因此,基于非结构网格的流场求解方法已成为工程应用领域的主流方法。相对于二阶格式,高阶精度格式有更小的数值耗散和色散,能够更加准确地预测复杂分离流、非定常流以及漩涡主导的流动,对于流场的精细化模拟有很大的优势。然而,高阶格式也存在稳定性差、计算效率低等问题,这些困难限制了其在工程领域中的应用。本文基于有限体积方法,完善了非结构网格高阶精度格式的基本框架,从流场求解的稳定性和计算效率出发,重点研究了高阶流场重构方法、高阶保精度限制器设计以及流场加速收敛方法等方面的内容。主要的研究工作如下:(1)发展了基于径向基函数的高阶有限体积流场重构方法。将多二次基函数用于非结构网格流场求解的重构步,并针对一维问题从理论上给出了多二次径向基函数方法的具体精度分析。典型的流场求解算例表明,相对于传统的基于泰勒级数多项式重构方法,径向基函数重构方法有更强的灵活性,在数值精度和耗散、色散特性等方面,有更大的优势。(2)提出了DWBAP和DDWENO两种能够适用于高阶格式的保精度限制器。其中,DWBAP限制器解决了传统BAP限制器拓展到非结构网格高阶格式精度损失的问题;DDWENO限制器结合了斜率限制器和WENO类格式,在固定模板上实现了WENO格式的效果,避免了进行大量候选模板重构的麻烦。通过二维、三维数值求解算例,表明发展的两种限制器均能够抑制激波间断附近产生的数值振荡,同时在光滑区域能够保证高阶数值精度。(3)提出了模态多重网格方法,实现了流场加速收敛。基于DMD分析技术,将物理空间的流场信息转换到模态空间,通过高频模态截断进行空间滤波,加速流场收敛速度。模态多重网格方法实施方便,巧妙避免了传统几何多重网格方法在粗细不同的计算网格中求解流动控制方程带来的一系列问题,有很广泛的适用性。此外,对于不同的空间离散方法、数值格式精度以及时间推进方法等均有很好的加速效果。
王金铭[10](2006)在《工程电磁场耦合问题分析的若干数值技术研究》文中认为许多复杂的工程问题,例如三维涡流场问题、磁场与流场耦合场问题,其数学模型均可表示为偏微分方程组的定解问题。这些偏微分方程组往往是非定常、非线性的,其数值求解不仅计算规模庞大,而且涉及到许多方面的数值技术,目前已成为国内外研究者关注的热点和难点。 本文以三维涡流场问题、磁场与流场耦合问题为例,对工程电磁场耦合问题分析中的若干数值技术进行了较深入的研究,具体内容如下: 三维涡流场问题是许多工程电磁场耦合问题的重要组成部分,在求其数值解时,线性代数方程组求解往往占据了整个计算所需要的大部分计算时间。本文针对三维涡流场问题分析中所形成的大型稀疏对称病态线性代数方程组,提出了两种改进型预处理共轭梯度法。其一在系数矩阵是对称正定的前提下,从减少共轭梯度法每一次迭代的计算量出发,提出了求解线性方程组的带有控制参数的改进型预处理共轭梯度法(PICCG1法),理论分析与实际计算表明PICCG1法的收敛速度与常规的ICCG法非常接近,而计算时间比ICCG法减少30%以上;其二在系数矩阵是对称非正定的前提下,从减少共轭梯度法的迭代次数出发,提出了求解线性方程组的带有控制参数的改进型预处理共轭梯度法PICCG2,理论分析与实际计算表明PICCG2法的迭代次数与常规的ICCG法相比明显减少,计算时间比ICCG法减少60%左右。 磁场与流场耦合问题不仅具有复杂的空间分布和时间变化,而且具有运动的介质,这类问题的数值技术正处在探索与发展阶段。本文针对磁场与流场耦合问题,提出了一种直接耦合解法并进行了仿真计算,具体包括以下五个方面:其一以磁流体动力学方程为依据,使用人工非定常化方法,进行适当的简化假设,得到了磁场与流场直接耦合问题的一种实用的定解问题,并将其用于电磁离心铸造等过程中的仿真计算中;其二在环形求解区域内,对上述定解问题中的时间变量使用向后差分法、空间变量使用有限体积法进行离散化得到相应离散化格式,并将其应用于实例计算中;第三用牛顿—拉夫逊方法求解上述离散化方程组,形成相应的迭代格式,并进行局部收敛条件分析;第四针对上述迭代格式为非对称、循环块三对角线性方程组,提出了一种带有控制参数的改进型直接三角分解法,并通过实际计算加以验证;最后以电磁离心铸造OCr17Mn14Mo2N
二、綫性代数方程组迭代收斂充分条件的改进(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、綫性代数方程组迭代收斂充分条件的改进(论文提纲范文)
(1)精细油藏数值模拟中的高效求解器研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景及课题来源 |
1.1.1 研究背景 |
1.1.2 课题来源 |
1.2 油藏数值模拟简介及研究现状 |
1.2.1 油藏数值模拟简介 |
1.2.2 研究现状 |
1.3 本文的主要研究工作 |
第二章 油藏数值模拟 |
2.1 岩石与流体的物性参数 |
2.1.1 孔隙度 |
2.1.2 渗透率 |
2.1.3 毛细管压力 |
2.1.4 泡点压力 |
2.1.5 溶解气油比 |
2.1.6 粘度 |
2.1.7 地层体积系数 |
2.2 线性渗流模型 |
2.2.1 可压多孔介质模型 |
2.2.2 微可压多孔介质模型 |
2.2.3 不可压多孔介质模型 |
2.2.4 模型的边界条件 |
2.3 油藏模型方程及其离散 |
2.3.1 黑油模型 |
2.3.2 黑油模型的全隐式离散 |
2.4 精细油藏模拟的重要性 |
第三章 高性能计算机体系架构及编程语言 |
3.1 高性能计算简介 |
3.1.1 并行计算机体系架构简介 |
3.1.2 并行算法效率的衡量 |
3.2 并行编程模式 |
3.2.1 基于消息传递接口的并行编程模式 |
3.2.2 基于共享存储的并行编程模式 |
3.2.3 基于图形处理器加速的并行编程模式 |
第四章 油藏模型方程的快速求解算法研究 |
4.1 矩阵的一些基本概念 |
4.2 迭代法 |
4.2.1 线性定常迭代法 |
4.2.2 线性定常迭代法的收敛性 |
4.2.3 Krylov子空间方法 |
4.3 代数多层网格法 |
4.3.1 代数多层网格法简介 |
4.3.2 代数多层网格法的收敛性 |
4.4 压力方程和饱和度方程的推导 |
4.5 解耦方法与压力方程求解 |
4.5.1 交错块分解解耦 |
4.5.2 拟隐压显饱解耦 |
4.5.3 隐压显饱解耦 |
4.5.4 压力方程求解 |
4.6 雅克比方程组的求解方法 |
4.6.1 CPR预条件子 |
4.6.2 多阶段辅助空间校正预条件子 |
第五章 油藏数值模拟的高效并行解法 |
5.1 稀疏矩阵的存储格式及矩阵向量乘法 |
5.1.1 稀疏存储格式 |
5.1.2 稀疏矩阵向量乘法在GPU上的实现 |
5.1.3 稀疏矩阵向量乘法的性能分析 |
5.2 不完全LU分解的并行算法研究 |
5.2.1 不完全LU分解 |
5.2.2 排序对算法的影响 |
5.2.3 并行不完全LU分解 |
5.2.4 数值试验 |
5.3 异构并行聚集代数多层网格法 |
5.3.1 两两聚集代数多层网格法的时间分布 |
5.3.2 并行磨光算子 |
5.3.3 粗空间求解 |
5.4 异构并行多阶段预条件子算法 |
5.5 分布式并行油藏求解器 |
第六章 数值实验 |
6.1 串行解法器的性能测试 |
6.1.1 两组份模型方程的数值求解 |
6.1.2 三组份模型方程的数值求解 |
6.1.3 超大规模精细油藏模拟 |
6.1.4 求解器速度对比 |
6.2 异构并行解法器的性能测试 |
6.3 分布式并行解法器的性能测试 |
第七章 结论和展望 |
7.1 结论 |
7.2 展望 |
致谢 |
参考文献 |
攻读博士期间发表和完成的相关论文 |
(2)辐射扩散计算方法若干研究进展(论文提纲范文)
0 引言 |
0.1 物理背景 |
0.2 离散格式 |
0.3 非线性迭代 |
1 扩散方程的有限体积格式 |
1.1 研究历史简介 |
1.1.1 九点格式 |
1.1.2 SOM格式 |
1.1.3 MPFA格式 |
1.1.4 单调格式 |
1.2 扩散格式的统一推导 |
1.2.1 多点通量逼近方法 |
1.2.2 局部支撑算子格式 |
1.2.3 九点格式 |
1.2.4 单调格式 |
1.2.5 注记 |
1.3 改进的扩散格式 |
1.4 数值结果 |
1.4.1 温度出负与非物理振荡 |
1.4.2 格式的精度 |
1.4.3 格式的单调性 |
2 非线性迭代方法 |
2.1 研究历史简介 |
2.1.1 非线性辐射扩散方程 |
2.1.2 非线性迭代 |
2.1.3 Picard迭代 |
2.1.4 Newton迭代 |
2.1.5 相关方法的研究 |
2.1.6 我们的研究目标 |
2.2 研究进展简介 |
2.2.1 新的非线性迭代设计途径 |
2.2.2 Picard-Newton迭代 |
2.2.3 迎风型Picard-Newton迭代 |
2.2.4 自适应Picard-Newton迭代方法 |
2.2.5 其它推广应用 |
2.3 数值结果 |
3 正在开展的工作 |
4 结束语 |
(3)偏微分方程迭代并行解法与网格优化方法(论文提纲范文)
绪论: 偏微分方程的并行数值解法 |
0.1 引言 |
0.2 偏微分方程并行数值解法中的问题 |
0.2.1 偏微分方程的并行差分格式 |
0.2.2 偏微分方程中求解线性代数方程组的迭代解法 |
0.3 本论文的主要工作 |
第一章 DU FORT FRANKEL预估的并行差分方法稳定性分析 |
1.1 引言 |
1.2 DFF格式并行差分格式的稳定性分析 |
1.2.1 稳定性分析 |
1.2.2 并行差分方法的矩阵表示 |
第二章 基于JACOBI修正的显式并行差分格式 |
2.1 介绍 |
2.2 对于s=3的情况 |
2.3 数值试验 |
第三章 界面修正的并行迭代差分格式 |
3.1 介绍 |
3.2 基于界面修正的迭代并行方法的一般框架 |
3.3 线性抛物型方程的并行差分方法 |
3.4 并行差分格式的理论分析。 |
3.5 数值例子 |
第四章 中子输运的并行离散纵标方法 |
4.1 中子输运方程介绍 |
4.2 并行中子输运方程迭代差分格式的算法 |
4.3 测试的数值算例 |
第五章 红黑排序混合KRYLOV算法及其应用 |
5.1 KRYLOV子空间算法和预条件技术 |
5.2 混合迭代算法 |
5.2.1 混合算法的介绍 |
5.2.2 红黑排序混合算法的理论分析 |
5.2.3 混合算法的收敛速度的理论加速 |
5.2.4 红黑排序混合算法的误差分析 |
5.3 数值试验 |
5.4 结论 |
5.5 红黑排序混合算法的应用 |
5.5.1 混合算法对辐射流体力学求解代数方程组的应用 |
5.5.2 混合算法在油藏模拟中的应用 |
5.5.2.1 混合算法及预条件技术 |
5.5.2.2 楼值模拟结果 |
第六章 界面预估与修正预条件技术 |
6.1 介绍 |
6.2 KRYLOV子空间算法和预条件的关系。 |
6.3 并行预条件的构造 |
6.4 对IPP预条件的谱分析(特殊情况:(?)_i=A_i) |
6.5 一般情况的讨论 |
6.6 数值试验 |
第七章 ALE方法中的一种网格优化算法 |
7.1 引言 |
7.2 组合优化的网格生成算法 |
7.3 数值试验 |
6.4 结论 |
附录: 常用KRYLOV算法 |
参考文献 |
致谢 |
博士期间发表论情况 |
(4)基于免组装技术的大型有限元和拓扑优化快速算法研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 选题背景和意义 |
1.2 研究现状 |
1.2.1 大型有限元求解技术 |
1.2.2 免组装有限元技术 |
1.2.3 拓扑优化技术 |
1.3 存在的问题与解决方案 |
1.4 本文研究内容 |
第二章 基于体素模型的免组装有限元法 |
2.1 引言 |
2.2 免组装压缩共轭梯度法 |
2.2.1 体素模型 |
2.2.2 压缩共轭梯度法 |
2.2.3 免组装技术 |
2.2.4 GPU并行运算 |
2.2.5 算例分析 |
2.3 基于非一致单元的免组装有限元 |
2.3.1 网格处理 |
2.3.2 算例分析 |
2.4 本章小结 |
第三章 基于免组装有限元的模态分析 |
3.1 引言 |
3.2 有限元模态分析 |
3.2.1 计算最低阶模态 |
3.2.2 计算多阶模态 |
3.3 子空间瑞利-里兹共轭梯度法 |
3.4 免组装压缩子空间瑞利-里兹共轭梯度法 |
3.5 算例分析 |
3.5.1 活塞连杆模态分析 |
3.5.2 变速箱箱体模态分析 |
3.6 本章小结 |
第四章 基于免组装有限元的拓扑优化法 |
4.1 引言 |
4.2 PareTO法 |
4.2.1 拓扑灵敏度 |
4.2.2 优化方法 |
4.3 免组装三维PareTO法 |
4.3.1 数学模型 |
4.3.2 拓扑优化算法流程 |
4.3.3 算例分析 |
4.4 多工况拓扑优化 |
4.4.1 多工况优化模型 |
4.4.2 有限元模型建立 |
4.4.3 加工约束 |
4.4.4 优化结果 |
4.5 本章小结 |
第五章 免组装有限元屈曲分析和屈曲拓扑优化 |
5.1 引言 |
5.2 基于免组装有限元的线性屈曲分析 |
5.2.1 有限元线性屈曲分析 |
5.2.2 逆迭代法 |
5.2.3 数值算例 |
5.3 屈曲灵敏度分析 |
5.3.1 半解析屈曲灵敏度 |
5.3.2 伴随法屈曲灵敏度 |
5.3.3 简化的屈曲灵敏度 |
5.3.4 不同灵敏度公式的对比 |
5.4 三维连续体结构的屈曲拓扑优化 |
5.4.1 优化模型与算法 |
5.4.2 算例分析 |
5.5 本章小结 |
第六章 免组装拓扑优化法在车架轻量化设计中的应用 |
6.1 引言 |
6.2 车身拓扑优化模型 |
6.3 整体弯曲工况拓扑优化 |
6.3.1 工况设置 |
6.3.2 拓扑优化数学模型 |
6.3.3 拓扑优化结果 |
6.4 整体扭转工况 |
6.4.1 工况设置 |
6.4.2 拓扑优化结果 |
6.5 弯扭组合工况 |
6.6 本章小结 |
第七章 总结与展望 |
7.1 全文工作总结 |
7.2 论文创新点 |
7.3 工作展望 |
参考文献 |
致谢 |
攻读博士学位期间发表的学术论文和参加科研情况 |
(5)基于GPU的矩阵计算并行加速方法研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 研究背景及意义 |
1.2 GPU计算技术及应用分析 |
1.2.1 GPU计算技术的发展 |
1.2.2 GPU硬件架构 |
1.2.3 GPU编程模型 |
1.3 矩阵计算的国内外研究现状及分析 |
1.3.1 科学计算中的矩阵计算研究现状 |
1.3.2 机器学习中的矩阵计算研究现状 |
1.3.3 研究现状总结 |
1.4 论文研究工作 |
第2章 稠密矩阵计算的自适应处理器选择方案 |
2.1 研究问题与动机 |
2.2 稠密矩阵计算 |
2.2.1 稠密矩阵存储 |
2.2.2 基础线性代数子程序 |
2.2.3 矩阵计算的并行算法 |
2.3 处理器选择方案 |
2.3.1 稠密矩阵计算在CPU和GPU上的实现 |
2.3.2 基本处理器选择方案 |
2.3.3 矩阵三角线性方程组的时间预估模型:teTRSM |
2.4 实验验证 |
2.4.1 实验设备 |
2.4.2 基本处理器选择方案的验证 |
2.4.3 teTRSM模型的验证 |
2.5 本章小结 |
第3章 基于完全逆矩阵块的稀疏对称正定线性方程组的预处理方法 |
3.1 研究问题与动机 |
3.2 稀疏对称正定线性方程组与预处理共轭梯度法 |
3.2.1 稀疏矩阵与存储 |
3.2.2 稀疏矩阵计算与并行实现 |
3.2.3 预处理共轭梯度法与GPU实现 |
3.3 基于完全逆的矩阵块预处理方法:BPDI |
3.3.1 BPDI预处理矩阵的非零元素分布 |
3.3.2 BPDI策略与算法 |
3.3.3 BPDI算法实现 |
3.3.4 计算复杂度分析与对比 |
3.4 实验验证 |
3.4.1 实验数据及实验设置 |
3.4.2 实验结果及分析 |
3.5 本章小结 |
第4章 基于样本并行的矩阵分解求解方法 |
4.1 研究问题与动机 |
4.2 求解矩阵分解的随机梯度下降法 |
4.2.1 矩阵分解求解策略 |
4.2.2 随机梯度下降法的并行化方法 |
4.2.3 随机梯度下降法的GPU实现 |
4.3 改进的GPU并行随机梯度下降法:eGPUSGD |
4.3.1 问题分析 |
4.3.2 GPU并行随机梯度下降法的线程任务优化 |
4.3.3 eGPUSGD算法与实现 |
4.3.4 性能分析与对比 |
4.4 实验验证 |
4.4.1 实验数据及实验设置 |
4.4.2 实验结果及分析 |
4.5 本章小结 |
附图 |
第5章 基于向量并行的矩阵分解求解方法 |
5.1 研究问题与动机 |
5.2 基于向量并行的随机梯度下降法:NewGPUSGD |
5.2.1 数据划分 |
5.2.2 NewGPUSGD的线程任务分配 |
5.2.3 性能分析与对比 |
5.3 实验验证 |
5.3.1 实验数据及实验设置 |
5.3.2 实验结果及分析 |
5.4 本章小结 |
结论 |
参考文献 |
攻读博士学位期间发表的论文及其他成果 |
致谢 |
个人简历 |
(6)非线性最优控制问题的保辛伪谱方法及其应用(论文提纲范文)
摘要 |
ABSTRACT |
1 绪论 |
1.1 研究背景与意义 |
1.2 非线性最优控制问题数值算法研究进展 |
1.2.1 间接法 |
1.2.2 直接法 |
1.2.3 其它方法 |
1.2.4 小结 |
1.3 最优控制问题中对于约束的处理 |
1.4 最优控制问题中对于时滞的处理 |
1.5 本文主要研究思路 |
2 最优控制问题数学列式及数学基础 |
2.1 引言 |
2.2 非线性最优控制问题数学列式 |
2.2.1 无约束非线性最优控制问题 |
2.2.2 含不等式约束的非线性最优控制问题 |
2.2.3 含状态时滞的非线性最优控制问题 |
2.3 最优控制问题的Hamiltonian数学结构 |
2.4 辛数学基础 |
2.4.1 Hamiltonian动力学系统及保辛概念 |
2.4.2 作用量及最小作用量原理 |
2.4.3 生成函数 |
2.5 伪谱方法 |
2.5.1 Lagrange插值与函数逼近 |
2.5.2 基于Legendre函数的Gauss积分 |
2.5.3 Legendre伪谱近似 |
2.5.4 微分矩阵 |
2.5.5 求解最优控制问题的Legendre伪谱方法 |
3 无约束非线性最优控制问题的保辛伪谱解法 |
3.1 引言 |
3.2 问题列式 |
3.3 算法构造 |
3.3.1 区间离散 |
3.3.2 在子区间内使用LGL型伪谱方法 |
3.3.3 对第一类生成函数施加变分原理 |
3.3.4 施加边界条件 |
3.3.5 求解非线性方程组 |
3.4 自适应hp网格加密技术 |
3.4.1 动力学方程残余误差 |
3.4.2 网格加密准则 |
3.4.3 基于保辛伪谱的非线性最优控制问题的hp自适应算法 |
3.5 数值算例 |
3.5.1 算例1:具有解析解的单自由度系统最优控制问题 |
3.5.2 算例2:两自由度Van der Pol振子系统的最优控制问题 |
3.5.3 算例3:超敏感最优控制问题 |
3.5.4 算例4:绕地航天器变轨交会问题 |
3.5.5 算例5:绳系卫星释放问题 |
3.6 本章小结 |
4 含不等式约束的非线性最优控制问题的保辛伪谱解法 |
4.1 引言 |
4.2 问题列式 |
4.3 问题转化 |
4.4 算法构造 |
4.4.1 区间离散 |
4.4.2 在子区间内使用LGL型伪谱方法 |
4.4.3 对第二类生成函数施加参变量变分原理 |
4.4.4 施加等式约束和互补条件 |
4.4.5 施加边界条件 |
4.4.6 构造线性互补问题并求解 |
4.5 数值算例 |
4.5.1 算例1: Breakwell问题 |
4.5.2 算例2: 日-地系统L2平动点Halo轨道变轨问题 |
4.5.3 算例3: 桥式起重机路径规划问题 |
4.5.4 算例4: 轮式机器人的避障轨迹规划问题 |
4.5.5 算例5: 混沌系统广义同步 |
4.5.6 算例6: 基于改进SEIR模型的传染病最优疫苗接种策略制定 |
4.6 本章小结 |
5 含状态时滞的非线性最优控制问题的保辛伪谱解法 |
5.1 引言 |
5.2 问题列式 |
5.3 问题转化 |
5.4 算法构造 |
5.4.1 区间离散 |
5.4.2 在子区间内使用LGL型伪谱方法 |
5.4.3 对子区间内第一类生成函数施加变分原理 |
5.4.4 对全局的第一类生成函数施加变分原理 |
5.4.5 施加边界条件 |
5.4.6 求解线性代数方程组 |
5.5 数值算例 |
5.5.1 算例1:具有解析解的时滞简谐振子最优控制问题 |
5.5.2 算例2:强非线性时滞系统的最优控制问题 |
5.5.3 算例3:时变Mathieu方程不同边界条件下的最优控制问题 |
5.5.4 算例4:具有转向时滞的运载器轨迹规划 |
5.5.5 算例5:化工装备温度控制问题 |
5.5.6 算例6:最优捕鱼策略制定 |
5.6 本章小结 |
6 保辛伪谱模型预测控制算法及其在起重机轨迹跟踪中的应用 |
6.1 引言 |
6.2 模型预测控制算法思想 |
6.3 桥式起重机控制问题描述 |
6.3.1 系统动力学方程 |
6.3.2 约束条件 |
6.3.3 控制目标 |
6.4 模型预测控制器的设计 |
6.5 数值仿真 |
6.5.1 系统参数设定 |
6.5.2 离线轨迹规划 |
6.5.3 在线轨迹跟踪 |
6.6 本章小结 |
7 保辛伪谱滚动时域估计算法及其在航天器自主导航中的应用 |
7.1 引言 |
7.2 滚动时域估计算法思想 |
7.3 地-月L2平动点导航问题描述 |
7.4 滚动时域估计器的设计 |
7.5 数值算例 |
7.5.1 系统参数设定 |
7.5.2 求解参数设定 |
7.5.3 仿真结果与讨论 |
7.6 本章小结 |
8 结论与展望 |
8.1 结论 |
8.2 创新点 |
8.3 展望 |
参考文献 |
攻读博士学位期间科研项目及科研成果 |
致谢 |
作者简介 |
(7)松弛迭代算法的加速方法研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究工作的背景与意义 |
1.2 国内外研究历史与现状 |
1.3 本文的主要贡献与创新 |
1.4 本论文的结构安排 |
第二章 四种迭代算法的介绍 |
2.1 加权雅可比迭代法 |
2.2 规划松弛雅可比迭代法 |
2.2.1 最优规划松弛雅可比迭代法 |
2.3 Anderson雅可比迭代法 |
2.3.1 Anderson加速 |
2.4 交替Anderson雅可比迭代法 |
2.5 本章小结 |
第三章 两种松弛迭代算法加速方法研究 |
3.1 交替Anderson规划松弛雅可比迭代法 |
3.2 最小残差规划松弛雅可比迭代法 |
3.3 本章小结 |
第四章 数值实验 |
4.1 Laplace模型问题 |
4.1.1 参数分析 |
4.1.2 五种算法的比较 |
4.2 变系数问题 |
4.2.1 两种新算法的特点 |
4.3 辐射扩散模型问题 |
4.4 本章小结 |
第五章 全文总结与展望 |
5.1 全文总结 |
5.2 后续工作展望 |
致谢 |
参考文献 |
攻读硕士学位期间取得的成果 |
(8)LAPW基组第一性原理计算的GPU加速方法及其应用(论文提纲范文)
致谢 |
摘要 |
Abstract |
1 绪论 |
1.1 第一性原理计算概述 |
1.2 GPU通用计算的优势 |
1.3 GPU通用计算在第一性原理计算中的应用 |
1.4 本文的创新点及内容安排 |
2 GPU通用计算基础 |
2.1 GPU的硬件架构 |
2.2 CUDA编程模型 |
2.2.1 CUDA线程模型 |
2.2.2 CUDA内存模型 |
2.2.3 CUDA流和并发执行 |
2.3 高性能数学计算库 |
2.4 本章小结 |
3 LAPW基组第一性原理计算研究 |
3.1 绝热近似 |
3.2 Hartree-Fock方程 |
3.3 密度泛函理论 |
3.3.1 Hohenberg-Kohn定理 |
3.3.2 Kohn-Sham方程 |
3.3.3 交换关联泛函 |
3.4 线性缀加平面波(LAPW)基组 |
3.4.1 缀加平面波(APW) |
3.4.2 线性缀加平面波(LAPW) |
3.5 LAPW基组第一性原理计算方法 |
3.5.1 匹配系数计算 |
3.5.2 Hamilton矩阵与Overlap矩阵的建立 |
3.5.3 广义特征方程求解计算 |
3.6 本章小结 |
4 LAPW第一性原理计算的GPU加速方法研究 |
4.1 引言 |
4.2 GPU加速的匹配系数计算模块 |
4.2.1 线程组织 |
4.2.2 内存使用策略 |
4.3 GPU加速的Hamilton矩阵与Overlap矩阵计算模块 |
4.3.1 矩阵乘法的优化 |
4.3.2 矩阵的转置与共轭 |
4.3.3 原子序数循环的并行优化 |
4.3.4 间隙区矩阵的计算 |
4.4 线性代数计算的优化 |
4.4.1 线性方程组求解计算 |
4.4.2 广义特征方程求解计算 |
4.5 本章小结 |
5 GPU加速LAPW方法在二维材料计算中的应用 |
5.1 二维CrI_3的基态计算 |
5.2 实验Ⅰ: 计算精度变化 |
5.2.1 二维CrI_3的基态计算 |
5.2.2 测试结果 |
5.2.3 加速比分析 |
5.3 实验Ⅱ: 体系规模变化 |
5.3.1 测试结果与分析 |
5.4 实验Ⅲ: 自洽迭代 |
5.4.1 测试结果与分析 |
5.5 本章小结 |
6 结论和展望 |
6.1 工作总结 |
6.2 未来展望 |
参考文献 |
作者简历及在学期间所取得的科研成果 |
(9)非结构网格高阶数值格式与加速收敛方法研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 计算流体力学概述 |
1.2 非结构网格高阶精度数值方法研究现状 |
1.2.1 有限体积方法 |
1.2.2 有限元方法 |
1.2.3 混合方法 |
1.3 非结构网格高阶精度数值方法存在的困难与挑战 |
1.3.1 计算量和存储量 |
1.3.2 数值稳定性 |
1.3.3 曲面边界条件处理 |
1.4 本文的主要研究内容 |
第二章 流动控制方程与高阶精度有限体积方法 |
2.1 流场控制方程 |
2.2 有限体积法基本思想 |
2.3 基于非结构网格的高阶精度有限体积方法 |
2.4 空间离散方法 |
2.4.1 流场重构 |
2.4.2 边界条件处理 |
2.4.3 数值通量 |
2.5 数值积分方法 |
2.6 时间推进方法 |
2.6.1 显式格式 |
2.6.2 隐式格式 |
2.7 本章小结 |
第三章 高阶精度有限体积流场重构方法 |
3.1 目前流场重构方法介绍 |
3.2 基于径向基函数的流场重构方法 |
3.3 径向基函数插值精度理论分析 |
3.4 流场求解数值算例 |
3.4.1 Euler方程精确解 |
3.4.2 无粘圆柱绕流 |
3.4.3 等熵自由涡 |
3.4.4 层流圆柱绕流 |
3.4.5 NACA0012 层流绕流 |
3.5 本章小结 |
第四章 高阶格式保精度限制器设计 |
4.1 非结构网格限制器主要研究思路 |
4.2 高阶保精度DWBAP限制器 |
4.3 高阶保精度DDWENO限制器 |
4.4 限制器在特征空间的实施 |
4.5 数值精度测试算例 |
4.5.1 Euler方程精确解 |
4.5.2 等熵自由涡 |
4.5.3 三维精度测试算例 |
4.6 间断流场求解算例 |
4.6.1 激波管算例 |
4.6.2 NACA0012 翼型无粘跨声速绕流 |
4.6.3 RAE2822 翼型无粘跨声速绕流 |
4.6.4 Mach=3的前台阶流动 |
4.6.5 Mach=10的双马赫反射算例 |
4.6.6 斜激波-混合层相互作用算例 |
4.6.7 ONERA M6 机翼跨声速绕流 |
4.7 本章小结 |
第五章 模态多重网格流场加速收敛方法 |
5.1 常用的流场加速收敛方法 |
5.2 模态多重网格方法 |
5.2.1 DMD模态分析方法 |
5.2.2 定常流场收敛过程的伪动力学模态分析 |
5.2.3 模态空间滤波与加速收敛机制 |
5.3 数值算例与分析 |
5.3.1 NACA0012 翼型亚声速绕流 |
5.3.2 RAE2822 翼型跨声速绕流 |
5.3.3 层流翼型绕流 |
5.3.4 ONERA M6 机翼跨声速绕流 |
5.4 本章小结 |
第六章 总结与展望 |
6.1 全文总结 |
6.2 本文创新点 |
6.3 工作展望 |
参考文献 |
致谢 |
攻读博士学位期间发表的学术论文和参加科研情况 |
(10)工程电磁场耦合问题分析的若干数值技术研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 工程电磁场耦合问题分析数值技术研究的背景及意义 |
1.2 工程电磁场耦合问题分析的数值技术研究概况 |
1.2.1 数学模型 |
1.2.2 离散化技术 |
1.2.3 非线性方程组解法 |
1.2.4 线性方程组数值解法 |
1.3 本文的主要工作 |
第二章 三维涡流场有限元离散化线性方程组解法研究 |
2.1 引言 |
2.2 三维涡流场的定解问题 |
2.2.1 三维瞬态涡流场的定解问题 |
2.2.2 三维正弦稳态涡流场的定解问题 |
2.3 三维涡流场的有限元离散化 |
2.3.1 三维正弦稳态涡流场的离散化格式 |
2.3.2 三维瞬态涡流场的离散化格式 |
2.4 有限元离散化线性代数方程组的解法 |
2.4.1 共轭梯度法 |
2.4.2 常规预处理共轭梯度法 |
2.4.3 对称正定线性方程组的改进型预处理共轭梯度法 |
2.4.4 对称非正定线性方程组的改进型预处理共辘梯度法 |
2.4.5 计算实例 |
2.5 小结 |
第三章 磁场与流场耦合问题的直接解法 |
3.1 引言 |
3.2 磁场与流场耦合问题的定解问题 |
3.2.1 控制方程的矢量形式 |
3.2.2 控制方程的分量形式及定解问题 |
3.3 离散化方法-有限体积法 |
3.3.1 求解区域剖分 |
3.3.2 时间变量的离散化 |
3.3.3 空间变量的离散化 |
3.4 非线性方程组解法 |
3.4.1 预备知识 |
3.4.2 磁场与流场耦合问题离散化非线性方程组的牛顿迭代法 |
3.5 非对称、循环块三对角线性方程组解法 |
3.5.1 LU分解定理 |
3.5.2 循环块三对角方程组的直接三角分解法 |
3.5.3 循环块三对角方程组的改进型直接三角分解法 |
3.6 计算实例-数值方法的比较 |
3.6.1 DLU法和MDLU法的比较 |
3.6.2 直接耦合解法与间接耦合解法的比较 |
3.7 小结 |
第四章 计算实例—电磁离心铸造过程的仿真计算 |
4.1 引言 |
4.2 电磁离心铸造过程中的磁场与流场耦合问题的定解问题 |
4.2.1 求解区域 |
4.2.2 控制方程的矢量形式 |
4.2.3 直角坐标系下的定解问题 |
4.3 数值仿真计算结果 |
4.3.1 磁感应强度与电磁力的仿真结果 |
4.3.2 流速与压力的仿真结果 |
4.4 实验结果 |
4.5 小结 |
第五章 结论 |
参考文献 |
在学研究成果 |
致谢 |
四、綫性代数方程组迭代收斂充分条件的改进(论文参考文献)
- [1]精细油藏数值模拟中的高效求解器研究[D]. 李政. 昆明理工大学, 2017(11)
- [2]辐射扩散计算方法若干研究进展[J]. 袁光伟,杭旭登,盛志强,岳晶岩. 计算物理, 2009(04)
- [3]偏微分方程迭代并行解法与网格优化方法[D]. 杭旭登. 中国工程物理研究院, 2004(01)
- [4]基于免组装技术的大型有限元和拓扑优化快速算法研究[D]. 卞翔. 西北工业大学, 2017(02)
- [5]基于GPU的矩阵计算并行加速方法研究[D]. 李丰. 哈尔滨工业大学, 2018(01)
- [6]非线性最优控制问题的保辛伪谱方法及其应用[D]. 王昕炜. 大连理工大学, 2019(06)
- [7]松弛迭代算法的加速方法研究[D]. 孔倩. 电子科技大学, 2019(01)
- [8]LAPW基组第一性原理计算的GPU加速方法及其应用[D]. 陆开诚. 浙江大学, 2019(01)
- [9]非结构网格高阶数值格式与加速收敛方法研究[D]. 刘溢浪. 西北工业大学, 2018(02)
- [10]工程电磁场耦合问题分析的若干数值技术研究[D]. 王金铭. 沈阳工业大学, 2006(10)