非线性微分方程的统计推断问题研究,统计学论文
第一章 绪论
1.1 常微分方程的统计推断简介
在自然科学的许多分支, 例如数学、生物学、生物化学或化学等, 常微分方程系统有着基础性的作用. 它通常是依赖某些参数的, 而这些参数在实践中往往没有精确值, 甚至是完全未知的. 因此了解这些参数对研究常微分方程刻画的动力系统是至关重要的. 这些参数在通常情况不能被直接测量, 它们必须从带有噪声的观测数据中推断或者估计出来. 尽管最小二乘法具有良好的理论特性, 但它在实际研究中还是有许多局限性.如果(1-1)是一个非线性高维系统(或 是高维的), 那么最小二乘法的性能在实践中将会大大降低. 在这种情况下, 我们就不得不面临许多非线性优化问题, 在高维参数空间中搜索最小二乘准则函数nR 的一个全局最小值, 其搜索过程往往是通过某种基于梯度的方法来完成的, 如 Levenberg-Marquardt 方法[2], 或者通过随机搜索办法来实现. 由于非线性系统并没有一个封闭的解, 因此在采用基于梯度的方法来搜索时, 必然会遇到计算积分的巨大困难. 同样的, 随机搜索方法在此问题上也是不可避免的, 用贝叶斯方法[3-4]估计 的值也会遭遇庞大计算量的问题.然而, 无论是最小二乘法还是贝叶斯方法, 都需要一个较为精确的参数初始值, 否则这两个方法就很难在合理的时间内收敛到真实值. 多年来对传统方法的改进算法已经在很多文献中提出, 特别是用于大规模非线性规划的多射法和内点或障碍方法[5]已被证明是相当成功的方法. 这两种方法往往比经典的基于梯度的方法稳定得多, 即使从一个较差的初始值也能收敛到真实值, 并且一般需要的迭代次数也相对较少. 事实上, 这些方法仍然需要依靠巨大的计算量才能完成.
…………
1.2 本文的主要工作和内容安排
目前, 常微分方程的统计推断问题还有巨大的研究空间. 就参数估计问题来说, 传统算法的计算量都是非常大的, 因此要在此基础上进行统计诊断研究将会成为一个更加困难的课题. 因此本文将基于两步估计法研究非线性常微分方程的统计推断问题.本文首先根据两步估计法, 把样条基函数引入非线性常微分方程的参数估计中做进一步的验证. 文中选择B 样条基函数对两步估计法进行理论推导, 之后以捕食模型为例进行模拟实验和实例研究, 通过具体实验再次检验两步估计法的有效性. 然后在两步估计法的基础上, 分别讨论基于数据删除模型和扰动模型的统计诊断问题. 同样用捕食模型的模拟和实际数据验证算法的可行性和有效性. 最后, 基于两步估计法考虑了常微分方程数据变换的参数估计问题, 并分别完成了基于对状态变量变换和时间变换的探究, 同时以捕食模型为例做了相应的实验.
……..
第二章 非线性 ODE 的两步估计
2.1概述
对非线性 ODE 而言, 在观测数据有噪声或干扰的情况下, 经典的参数估计方法采用NLS方法解决. 因为求方程的解析解是很困难的, 而数值解计算量非常大,若要在此基础上进行统计诊断研究就更加困难了. Ramsay(2007)引入样条基函数的概念, 提出一种新的常微分方程参数估计法[9-10]. 该方法是在一种修正的数据光滑法和推广的截面估计法的基础上提出来的. 作者通过化学工程和神经学的实验论证了该方法是合理的. 这一方法的提出为常微分方程的参数估计问题开辟了新道路. Zho(u2012)基于 HIV模型进一步讨论了常微分方程的两步估计法[11-12],同时构造出用于统计诊断的 Cook 统计量. 文中通过对模拟数据和临床数据的研究发现该统计量能够有效检测出一定程度的偏移, 并且发现数据的边界点对 HIV模型的参数估计影响比内部数据更大. 作者指出该方法也可推广到其他线性常微分方程模型的统计诊断问题中. Han(2013)对基于递归滤波算法的非线性状态空间模型的统计推断法进行了深入的研究[13], 作者利用状态空间概念对HIV动力系统进行深入讨论.本章将通过模拟数据和实际数据对非线性 ODE 的两步估计法的合理性进行验证. 第一节介绍两步估计法的基本步骤, 导出计算公式. 第二、三节以捕食模型为例分别进行模拟和实例分析, 进一步说明算法的可行性和有效性. 这将为第三章的统计诊断和第四章的数据变换等研究奠定基础.
……….
2.2 模拟实验
上一节介绍了非线性 ODE 的两步估计法. 从理论上看是可行的. 为了进一步验证其有效性, 本节以捕食模型[40]为例进行具体的模拟实验.大自然中的不同种群间存在一种很有趣的生存方式, 它们之间既有相互依存的关系, 同时又有制约关系. 种群 A依靠自然资源生存, 对于种群B , 则靠捕食种群 A为生. 就如野兔和山猫、食用鱼和鲨鱼、落叶松和蚜虫等. 种群 A和种群B 在生态学上分别被称食饵(Prey)和捕食者(Predator), 两者对于该系统都是不可或缺的, 共同组成了食饵—捕食者系统(简称 P-P 系统), 整体地看, 各个参数的估计值在以上不同情况下都是很精确的. 具体地看,若对每个表格单独分析可知: 在噪声相同的情况下, 观测点个数越多, 参数的估计越精确; 若对表格再进行纵向比较, 我们发现: 在观测点个数相同的情况下,噪声越小, 参数的估计越精确, 这一结论很符合实际.
………
第三章 基于两步估计的 ODE 统计诊断.......... 13
3.1 数据删除模型....... 13
3.1.1 统计诊断简介..... 13
3.1.2 数据删除模型的基本思想.......... 16
3.1.3 广义 Cook 距离和 Cook 距离..... 17
3.2 基于数据删除模型的 ODE 统计诊断.......... 19
3.3 扰动模型 ...... 22
3.4 基于扰动模型的 ODE 统计诊断.......... 24
3.5 模拟实验 ...... 26
3.6 实例研究 ...... 28
第四章 基于两步估计的 ODE 数据变换.......... 31
4.1 数据变换模型....... 31
4.2 状态变量变换....... 35
4.3 时间变换.......36
4.4 模拟实验.......38
4.5 实例研究.......41
第四章 基于两步估计的 ODE 数据变换
第三章研究了 ODE 的两种统计诊断方法, 如果数据经过统计诊断发现的问题比较多, 那么就不能简单地删除一两个有问题的点来改善拟合. 其次, 如果直接对观测数据进行拟合的效果并不理想, 那么在此基础上进行统计诊断也就不会得到很好的效果. 近年来的实践证明, 数据变换在处理这些问题方面能发挥巨大的作用.本章基于两步估计法, 对常微分方程的数据变换问题进行详细讨论. 第一节介绍了数据变换模型的基本思想, 为下文做好理论工作. 第二、三节分别从状态变量变换和时间变换这两个方面估计变换参数, 从而选择更适合于数据的变换来改进拟合效果. 第四、五节仍以捕食模型为例进行模拟和实例研究, 从实验的角度证明算法的有效性.
………..
结束语
非线性常微分方程模型已应用到各个领域的实际研究中, 比如生物学和医学等. Ramsay 在其文章中首次将样条基函数引入到微分方程中, 为常微分方程的参数估计提供了很好的方法. 本文根据常微分方程的两步估计法, 选择B 样条基函数, 以非线性常微分方程为研究背景, 详细讨论了基于两步估计法的统计诊断方法以及常微分方程的数据变换问题.文章首先介绍了常微分方程的两步估计法, 以捕食模型为例, 分别进行了模拟实验和实例研究. 为了反应噪声和观测点个数对参数估计的影响, 文章在两部估计法的模拟实验中选择了三种不同的噪声和观测点个数依次进行实验, 再次证明了两步估计法的可行性和有效性. 模拟结果显示, 在不同噪声和观测点个数下的参数估计都很精确, 并且算法的运行效果良好. 与传统的参数估计方法相比,两步估计法可直接根据带有噪声的观测数据, 对模型的参数进行准确估计, 避免了以往分析非线性方程中有可能会碰到的一些艰深的理论问题. 另外根据该算法对加拿大山猫数据进行了具体实验, 估计出模型中的参数, 从拟合结果看效果也是大致合理的. 对基于两步估计法的统计诊断问题的研究是本文的主要工作之一. 在该部分, 本文给出了基于两个模型的广义 Cook 距离, 这使统计诊断的效率大大提高. 在该部分模拟实验中为了研究不同偏移对统计诊断结果的影响,分别对两种不同的偏移进行了实验, 其结果充分表明了基于数据删除模型和扰动模型的统计诊断方法是可行有效性的, 能够准确地探测到数据中存在的异常点. 由实验结果还可得出这样的结论: 在人为偏移较大时, 检测效果比偏移较小的情况明显的多. 该统计诊断方法也通过对实际数据的实验得到检验.
…………
参考文献(略)
,
本文编号:11843
本文链接:https://www.wllwen.com/caijicangku/wuyoulunwen/11843.html