精细油藏数值模拟中的高效求解器研究
本文选题:油藏数值模拟 + 多层网格法 ; 参考:《昆明理工大学》2017年博士论文
【摘要】:随着复杂类型油藏(低渗、高含水、复杂岩性油藏等)开发的日益深入和提高采收率技术的推广使用,油藏数值模拟所依据的数学模型变得越来越复杂,同时油藏地质模型趋向精细化、网格复杂化、井数增加以及类型多样化等,这些因素导致渗流模型数值离散所形成的雅克比线性代数方程组的规模大、性态坏。在全隐式油藏数值模拟计算中,雅克比线性代数方程组的求解是一个主要瓶颈,其求解时间往往占据整个模拟计算时间的70%~80%,而且随着问题规模增大,该比重会进一步提高。设计高效的数值求解算法来提高雅克比线性代数方程组的求解速度是缩短数值模拟时间最有效的途径之一。另外当前计算机的硬件架构越来越异构化,利用众核处理器(如GPU、MIC)来协助CPU计算的解决方案在科学计算领域正释放巨大的能量,并掀起一股新的高性能异构并行计算浪潮。本文针对经典标准黑油模型,为其全隐式离散得到的雅克比线性代数方程组设计高效的串、并行求解算法。首先,针对黑油模型的强耦合雅克比离散代数方程组,我们分析几种常用解耦方法,如交错块分解解耦、拟隐压显饱解耦、隐压显饱解耦,并分别考察这几种方法的解耦效果以及对压力方程椭圆性的影响。我们发现:交错块分解解耦方法能很好地削弱压力变量和饱和度变量以及饱和度变量和饱和度变量之间的耦合关系,同时对雅克比矩阵的特征值有很好的聚集作用,但该方法破坏了压力方程的椭圆性,使压力方程求解难度增加;拟隐压显饱解耦和隐压显饱解耦方法借助IMPES方法的思想,通过代数方法得到一个椭圆性较好的压力方程,但该解耦方法只削弱了压力方程中压力变量与饱和度变量的耦合程度。针对上述三种解耦方法得到的压力方程,本文分别比较了经典AMG方法、VMB聚集AMG方法以及Pairwise聚集AMG方法的求解速度,并简单分析上述三种AMG方法在求解经不同解耦方法得到的压力方程时收敛速度差异大的原因。经上述分析,我们将隐压显饱解耦方法与经典CPR预条件子结合起来形成一类分裂型预条件子,并用Pairwise聚集AMG方法取代经典AMG方法来求解压力方程,此分裂型预条件子的求解速度较交错块分解解耦方法与经典CPR预条件子组成的分裂型预条件子快了近50%。其次,由于当前油藏模拟向精细化发展,雅克比矩阵规模突破千万量级且性态越趋病态,给雅克比线性代数方程组的求解带来了极大困难,研发针对精细油藏模拟带来的超大规模雅克比线性代数系统的高效、稳健求解算法是十分必要的。本文利用交错块分解解耦方法具有聚集雅克比矩阵特征值以及削弱物理变量间耦合关系的性质,基于辅助空间校正思想,提出了一种稳健、高效、节省内存的分裂型预条件子。该分裂型预条件子采用交错块分解解耦方法作为左预条件子,然后针对交错块分解方法解耦后的雅克比矩阵的性质,设计了一种多阶段辅助子空间右预条件子BASP:首先在饱和度子空间用块高斯赛德尔方法对饱和度方程进行一次近似求解,消除饱和度部分的高频误差部分;其次针对带强间断系数的椭圆型压力方程,我们采用AMG预条件Krylov方法来近似求解达到一定精度,消除由压力方程控制的低频误差;最后在全空间做一次块高斯赛德尔磨光。通过大量油田实例测试,该分裂型预条件子整体表现得十分高效及稳健。基于该预条件子的模拟器的求解速度比国际主流商业模拟器快2到3倍,且在台式工作站上成功模拟了千万网格规模的精细油藏模型。最后,本文基于CPU-GPU异构体系设计一种求解雅克比线性代数方程组的高效并行线性解法器。当前超级计算机的计算能力越来越强大,但体系结构日趋复杂,大多数采用多核、众核处理器、大型高速缓存、高带宽进程间通信结构和高速I/O功能的设计模式。如何构建现代化高性能应用软件来充分利用计算机的异构架构特点和资源是十分值得探索的。本文针对油藏模拟中的雅克比矩阵的结构特点,提出了一种适合GPU访存特点的BHYB的稀疏存储格式,基于该格式的SpMV的加速比最高达19倍,比世界著名的Nvidia公司研发的高效CuSparse软件包最快的HYB格式快30%;其次基于GPU的SIMT编程模拟,本文提出了一种双密集型并行策略,设计了一种并行度高、并行可扩展性好的BILU(l)方法,其中BILU(0)分解阶段和三角求解阶段的平均加速比分别达到6.27倍和9.46倍;最后结合计算机的异构特点以及AMG算法各部分的可并行度,设计了一种异构并行UA AMG方法,且该并行UA AMG方法没有损失串行UA AMG方法的收敛速度。通过整合上述并行模块,我们形成了一种基于CPU-GPU异构体系的并行BCPRP预条件子。数值试验表明该并行预条件子十分稳健,相比改进后的串行BCPRP预条件算法,该并行BCPRP预条件子在单GPU卡上的求解速度提高了 3.0倍左右。此外,基于"天河二号"超级计算机,我们研发了一套分布式并行求解算法,将模拟规模扩展到亿量级网格单元的同时,也极大提高了油藏模拟效率。该分布式并行求解器在千核以内都具有良好的可扩展性,但扩展到10,008个CPU物理核心后,分布式并行求解器的强可扩展性还不够理想,线性求解器算法还有待进一步优化。
[Abstract]:With the increasing development of complex type reservoir (low permeability, high water cut, complex lithologic reservoir, etc.), the mathematical model based on the reservoir numerical simulation becomes more and more complex, and the reservoir geological model tends to be refined, the grid is complicated, the number of wells is increased, and the types are diversified. These factors lead to these factors. The Jacobian linear algebraic equations formed by the numerical dispersion of the percolation model are large and bad. In the numerical simulation of all implicit reservoirs, the solution of the Jacobian linear algebraic equations is a major bottleneck, and the solution time tends to occupy 70% to 80% of the whole simulation time, and with the scale of the problem increasing, the proportion of the equations is increased. It will be further improved. It is one of the most effective ways to improve the speed of solving the Jacobian linear algebraic equations. In addition, the hardware architecture of the current computer is becoming more and more isomerized, using the multiprocessor (such as GPU, MIC) to help the solution of CPU computing in scientific computing collar. The domain is releasing huge energy and set off a new wave of high performance heterogeneous parallel computing. This paper designs an efficient string and parallel algorithm for the Jacobian linear algebraic equations for the classical standard black oil model. First, we analyze the strong coupled Jacobian discrete algebraic equations of the black oil model. Several common decoupling methods, such as staggered block decomposition decoupling, quasi implicit explicit saturation decoupling and implicit pressure explicit saturation decoupling, are used to investigate the decoupling effect of these methods and the influence on the ellipticity of pressure equations respectively. We find that the staggered block decomposition decoupling method can well weaken the pressure variation and saturation variable, saturation variable and saturation. The coupling relationship between variables has a good aggregation effect on the eigenvalues of the Jacobian matrix, but the method destroys the ellipticity of the pressure equation and increases the difficulty of the pressure equation. The method of the pseudo implicit pressure explicit saturation decoupling and implicit pressure saturation decoupling can obtain a better ellipticity by means of the IMPES method. The decoupling method only weakens the coupling degree of pressure variable and saturation variable in the pressure equation. According to the pressure equations obtained by the three decoupling methods mentioned above, this paper compares the solution speed of the classical AMG method, the VMB aggregation AMG method and the Pairwise aggregation AMG method, and simply analyzes the above three AMG methods to solve the problem. After the above analysis, we combine the implicit pressure explicit decoupling method with the classical CPR preconditioners to form a class of split preconditioners, and use the Pairwise aggregation AMG method to replace the classical AMG method to solve the pressure equation, and the solution of the split preconditioner is solved. The decomposition decoupling method compared with the staggered block decomposition is nearly 50%. next to the split preconditioners composed of the classical CPR preconditioners. Due to the development of the current reservoir simulation, the size of the Jacobian matrix breaks through tens of millions of orders and the more morbid state of the state, which brings great difficulties to the solution of the Jacobian linear algebraic equations. The efficient and robust algorithm for the large scale Jacobian linear algebraic system brought by the reservoir simulation is very necessary. This paper uses the interlaced block decomposition decoupling method to gather the eigenvalues of the Jacobian matrix and weaken the coupling relationship between the physical variables. Based on the auxiliary space correction idea, a robust, efficient and economical method is proposed. The split preconditioners are used as left preconditioners using the staggered block decomposition decoupling method, and then a multi-stage auxiliary subspace right preconditioners BASP: is designed to saturate the saturation subspace by the block Gauss Seidel method. The degree equation is an approximate solution to eliminate the high frequency error part of the saturation part; secondly, for the elliptic pressure equation with the strong interbreak coefficient, we use the AMG preconditioned Krylov method to approximate a certain precision and eliminate the low frequency error controlled by the pressure equation; finally, we do a block Gauss Seidel polishing in the whole space. Through a large number of oil field examples, the split preconditioners are highly efficient and robust. The speed of the simulator based on the preconditioners is 2 to 3 times faster than the international mainstream commercial simulator, and the fine oil reservoir model of tens of millions of grids is successfully simulated on the desktop workstation. Finally, this paper is based on the CPU-GPU isomeric system. An efficient parallel linear solution for solving the Jacobian linear algebraic equations is designed. The computing power of the supercomputer is becoming more and more powerful, but the architecture is becoming more and more complex. Most of them are multi core, many core processors, large cache, high bandwidth inter process communication structure and high speed I/O function design mode. Using high performance applications to make full use of the features and resources of the computer's isomeric architecture is worth exploring. In this paper, a sparse storage format for BHYB, which is suitable for GPU storage characteristics, is proposed for the structure characteristics of the Jacobian matrix in reservoir simulation. The acceleration ratio of SpMV based on this format is 19 times higher than that of the world famous Nvi The fastest HYB format of high efficiency CuSparse software package developed by dia company is fast 30%. Secondly, based on SIMT programming simulation based on GPU, a double dense parallel strategy is proposed in this paper. A BILU (L) method with high parallelism and good parallel scalability is designed, in which the average acceleration ratio of the BILU (0) decomposition stage and the triangle solution phase is 6.27 times respectively. 9.46 times; finally, a heterogeneous parallel UA AMG method is designed based on the heterogeneity of the computer and the parallelism of each part of the AMG algorithm. And the parallel UA AMG method does not lose the convergence speed of the serial UA AMG method. By integrating the parallel modules, we form a parallel BCPRP preconditioners based on the CPU-GPU isomer system. The numerical experiment shows that the parallel preconditioners are very robust. Compared with the improved serial BCPRP precondition algorithm, the parallel BCPRP preconditioners can improve the solution speed of the single GPU card by 3 times. In addition, based on the "Tianhe two" supercomputer, we developed a set of distributed parallel algorithm to expand the simulation scale to 100 million. At the same time, the efficiency of reservoir simulation is greatly improved. The distributed parallel solver has good scalability within thousands of cores, but after extending to 10008 CPU physical cores, the strong scalability of the distributed parallel solver is not ideal, and the linear solver algorithm still needs to be further optimized.
【学位授予单位】:昆明理工大学
【学位级别】:博士
【学位授予年份】:2017
【分类号】:TE319
【相似文献】
相关期刊论文 前9条
1 鲍文娣;李维国;;块斜循环矩阵预条件方程组的快速算法[J];中国石油大学学报(自然科学版);2007年04期
2 蒋涛;胡文宝;;基于频域有限差分的三维大地电磁的低感应数预条件求解方法研究[J];石油天然气学报;2014年09期
3 霍志周;熊登;张剑锋;;预条件共轭梯度法在地震数据重建方法中的应用[J];地球物理学报;2013年04期
4 郭煜;畅大为;;预条件P_鋽=I+鋽下的USSOR迭代方法及其比较定理[J];西安工程大学学报;2012年03期
5 童凯郁;;一种预条件的再开始的GMRES算法[J];江苏工业学院学报;2008年02期
6 张保祥;;H-矩阵的预条件AOR迭代法及其收敛性[J];齐齐哈尔大学学报;2008年06期
7 田秋菊;李金秋;;预条件USSOR迭代法及比较定理[J];辽宁石油化工大学学报;2011年04期
8 相鹏;;一种改进的二维MT预条件非线性共轭梯度反演方法[J];中国石油大学学报(自然科学版);2014年04期
9 朱建伟,孙乐林;对称区域分裂与循环约化:MIMD计算机上的一种快速并行算法[J];江汉石油学院学报;2001年03期
相关会议论文 前10条
1 梅金顺;刘洪;;预条件方程组及其应用[A];中国科学院地质与地球物理研究所二○○四学术论文汇编·第三卷(油气·矿产·水资源)[C];2004年
2 刘喜武;刘洪;;实现稀疏反褶积的预条件双共轭梯度法[A];中国科学院地质与地球物理研究所二○○三学术论文汇编·第四卷(油气资源)[C];2003年
3 柯涛;丁建军;丁大志;樊振宏;陈如山;;特征谱双步预条件结合多分辨预条件技术快速分析电磁散射问题[A];2007年全国微波毫米波会议论文集(上册)[C];2007年
4 丁大志;王晨;张清荣;陈如山;;加速多层快速多极子的近区迭代预条件方法的应用(英文)[A];2005'全国微波毫米波会议论文集(第一册)[C];2006年
5 霍志周;熊登;张剑锋;;预条件共轭梯度法在地震数据重建方法中的应用[A];中国科学院地质与地球物理研究所2013年度(第13届)学术论文汇编——油气资源研究室[C];2014年
6 姜兆能;陈如山;陈华;樊振宏;丁大志;;多分辨预条件结合混合形式快速多极子算法分析低频散射问题[A];2009年全国微波毫米波会议论文集(下册)[C];2009年
7 肖映雄;陈鹏;舒适;;两类网格结构模型的预处理方法[A];中国计算力学大会'2010(CCCM2010)暨第八届南方计算力学学术会议(SCCM8)论文集[C];2010年
8 董健;柴舜连;毛钧杰;;预条件技术和迭代算法在高效实现MLFMA中的对比研究[A];2005'全国微波毫米波会议论文集(第三册)[C];2006年
9 赵延文;张雪峰;陆田;杨颖怡;;矩阵预条件技术在时域积分方程MOT算法中的应用[A];2009年全国天线年会论文集(上)[C];2009年
10 阙肖峰;聂在平;;一类基于MLFMA的分组稀疏近似逆预条件技术[A];2009年全国天线年会论文集(上)[C];2009年
相关博士学位论文 前10条
1 李正光;结构布局修改静力重分析的预条件共轭梯度法[D];吉林大学;2004年
2 郭翰;电磁积分方程新型预条件及直接求解法的研究与应用[D];电子科技大学;2015年
3 李政;精细油藏数值模拟中的高效求解器研究[D];昆明理工大学;2017年
4 张勇;线性方程组预条件技术及在二维三温问题中的应用和实现[D];电子科技大学;2008年
5 任志刚;预条件算法及在电磁场数值模拟中的应用[D];电子科技大学;2010年
6 李月卉;电磁场数值求解中迭代方法与预条件技术研究[D];电子科技大学;2011年
7 张振宇;数值线性代数中的若干问题[D];复旦大学;2003年
8 沈海龙;线性代数系统迭代解法与预条件方法研究[D];东北大学;2013年
9 王瑞瑞;求解某些特殊稀疏线性系统的数值解法[D];厦门大学;2009年
10 程光辉;大型稀疏线性代数系统迭代解法研究[D];电子科技大学;2008年
相关硕士学位论文 前10条
1 刘金妮;近似逆预条件子的研究[D];电子科技大学;2009年
2 谭林;两类典型微分方程离散化系统的预条件子研究[D];湘潭大学;2006年
3 丁萍;稀疏线性系统中基于GPU的预条件共轭梯度法并行优化方法的研究[D];华南理工大学;2015年
4 刘路;电大目标电磁散射中的并行预条件技术[D];南京理工大学;2015年
5 宋萍萍;箔条云电磁散射及多普勒频移特性分析[D];南京理工大学;2015年
6 卫书根;应用RPS构造预条件子粗空间的两水平加性的Schwarz方法[D];上海交通大学;2015年
7 张钰;表面电磁缺陷散射建模及其RCS缩减研究[D];电子科技大学;2016年
8 徐红丹;Calderon预条件结合H~2矩阵算法求解电磁散射问题[D];南京邮电大学;2016年
9 王锦;一种求解三维Neumann边界条件线弹性问题线性有限元方程的高效预条件子[D];湘潭大学;2016年
10 梁爽;RDF预条件方法的优化[D];东北师范大学;2016年
,本文编号:1972344
本文链接:https://www.wllwen.com/shoufeilunwen/gckjbs/1972344.html