基于贝叶斯分析的隐马尔可夫模型及其应用
发布时间:2017-11-22 09:24
本文关键词:基于贝叶斯分析的隐马尔可夫模型及其应用
更多相关文章: 隐马尔可夫模型 MCMC算法 并行抽样 标号互换
【摘要】:隐马尔可夫模型是一个双随机过程,模型包含马尔可夫链以及观测序列两部分,其中,马尔可夫链是不可观测的,通常称之为状态。该模型已经在语音识别、图像分析和基因序列研究等方面得到广泛的应用。随着对模型的结构特点以及参数估计方法等方面的深入研究,隐马尔可夫模型的应用领域不断拓宽,目前已经成为应用最广泛,最成功的统计模型之一。本文主要介绍相依分布为泊松分布以及正态分布的隐马尔可夫模型,为探讨隐马尔可夫模型的实际应用,分别选取地震统计数据和标普500指数进行实证分析,文章具体包含以下两个方面的内容:第一,介绍泊松隐马尔可夫模型及其在地震统计数据中的应用。首先,对模型进行贝叶斯分析,为了有效避免参数抽样过程出现“标号互换”问题,对均值参数进行重新参数化。推导模型参数的条件后验分布,并构建基于Gibbs抽样的MCMC算法。在模型状态数的估计问题上,本文采用并行抽样算法,该算法通过计算后验模型概率来选择最佳模型。随机模拟数据的建模分析表明:并行抽样算法能有效估计模型的状态数。其次,在实证分析方面,我们选择了1900年至2006年全球地震统计数据,数据包含107个样本,根据数据过度离散化及存在强相关性的特点,对数据建立状态数未知的泊松隐马尔可夫模型,设定最大的状态数为4,当状态数为3时,取得最高后验模型概率为0.762,即对于地震统计数据,状态数为3的泊松隐马尔可夫模型是最佳模型。第二,介绍正态隐马尔可夫模型及其在金融收益率数据分析中的应用。首先,对模型进行贝叶斯分析并推导参数的条件后验分布。由于隐马尔可夫模型的似然函数不随着模型参数排列顺序的改变而改变,这种性质使得参数在抽样过程中容易出现“标号互换”问题。对参数进行人为限制是解决“标号互换”问题最简单的方法,但此方法并不总是有效的。因此,我们对“标号互换”问题及其解决方法进行详细介绍。其次,对标普500指数的对数收益率进行实证分析,数据包含1258个样本。参数的Gibbs抽样过程中出现了“标号互换”问题,利用本文介绍的方法对抽样结果进行重新标号。通过比较隐马尔可夫模型的拟合曲线和正态分布曲线发现:在描述收益率数据的分布特征方面,隐马尔可夫模型能较好的近似样本数据的真实分布。本文的创新点包括:将贝叶斯隐马尔可夫模型应用到地震数据和金融收益率数据分析中,并构造相应的MCMC算法。在模型状态数的估计问题上,采用并行抽样算法得到最高后验概率模型。最后,在对收益率数据拟合正态隐马尔可夫模型中,成功解决参数抽样的“标号互换”问题。
【学位授予单位】:华南农业大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:O212.8;O211.62
【参考文献】
中国期刊全文数据库 前2条
1 徐冰;李景文;;基于独立混合模型的EM算法参数初始化实现方法[J];信号处理;2010年12期
2 苗苗;马海武;;HMM在语音识别系统中的应用[J];现代电子技术;2006年16期
,本文编号:1214235
本文链接:https://www.wllwen.com/kejilunwen/yysx/1214235.html