当前位置:主页 > 科技论文 > 自动化论文 >

变分推理及贝叶斯方法在主题模型中应用的研究

发布时间:2020-05-10 13:36
【摘要】:贝叶斯方法作为机器学习的主流方法之一,为推动人工智能等诸多领域的发展做出了重要贡献。贝叶斯模型的推理是贝叶斯方法的核心。贝叶斯模型的一个关键问题是计算后验分布,然而在很多实际应用中,后验分布难以计算精确解,只能寻求近似解,变分方法是目前解决这一问题的一种常用方法。贝叶斯方法的一个重要应用是文本挖掘。随着大数据的快速发展,挖掘文本隐含的主题信息受到工业界和学术界的极大关注。主题模型作为一类重要的贝叶斯模型是挖掘文本主题信息的主流模型。该模型将主题定义成关于词项的多项分布,用边缘概率最大的前M个单词组成前端单词列表作为主题的一种表示。本文围绕着贝叶斯方法及其应用进行研究,主要包括两个部分。第一部分是对贝叶斯方法中的一类主流方法,即变分推理方法进行研究。第二部分是对贝叶斯方法在主题模型中的应用进行研究。具体工作内容如下:1.主流的传统变分推理方法主要包括标准的变分推理(mean-field variational inference,MFVI),可积分的变分推理(collapsed variational Bayesian inference,CVB),hybrid变分推理(hybird variational-Gibbs,HVG)以及期望传播方法(expectation propagation,EP)。上述方法被广泛用于各种实际问题中,但是哪种方法适合哪类应用是没有衡量标准的。因此对于一个实际的应用,在没有执行完所有的推理方法之前,很难准确地直接找到一个适合于此应用的推理方法。因此,本文面向LDA(latent Dirichlet allocation)模型从两个方面:(1)变分分布的形式;(2)a-散度类型,对上述这四种推理方法进行了系统地理论分析,得到关于计算精度的排名是CVBEP≈HVGMFVI,时间复杂度的排名为MFVIEP=HVGCVB(从高到低),空间复杂度的排名为CVBEP=HVG=MFVI(从高到低)。为了进一步验证上述理论分析,本文面向LDA模型,在2个人工合成数据集和5个实际应用数据集上,使用两种常用的评价标准,即perplexity和pointwise mutual information(PMI)评分,分别对这四种方法的预测性能和推断出的主题质量进行比较。实验结果和理论分析几乎保持一致,即CVB方法比其他三种方法近似效果更好、效率更快。对于大多数的实际应用,在不考虑空间要求的情况下建议使用CVB方法。2.大多数传统变分推理方法都是基于平均场假设的,忽略了变量之间的依赖关系,这对于某些具有变量依赖关系的模型来说是不适用的,常常会导致变分过程计算精度下降,出现低估的趋势。Copula变分推理(copula variational inference,CVI)使用copula函数可以很好地解决模型中变量依赖问题,提高变分过程的计算精度。但是CVI方法需要从copula扩展的变分分布中采样形成目标函数的蒙特卡洛梯度,这是一个非常耗时的过程,特别是对于变量较多的复杂模型,因此CVI方法对于很多实际应用是不可行的。为了加快CVI方法的推理速度,本文提出fast CVI方法(FCVI)。FCVI方法将目标函数的蒙特卡洛梯度表示成相对于平均场的期望形式,因此只需要从更简单的平均场分布中采样,而不需要从copula扩展的变分分布中采样,就可以对蒙特卡洛梯度进行估计。因此本文提出的方法在采样过程中效率更高,将时间复杂度从O(D~2)降低到O(D)。本文使用高斯混合模型(Gaussian mixture model)和隐空间模型(latent space model),在人工合成数据集和实际应用数据集上验证FCVI方法的高效性和可行性。实验结果表明FCVI方法在保证计算精度的同时,加速了CVI方法的推理时间。3.传统的主题表示方法是用边缘概率最大的前M个单词组成前端单词列表作为主题的一种表示方法。但是在某些实验中发现主题的前M个单词列表中经常包含一些不具有代表性(representative)的单词,甚至是无意义的噪声词。因此,本文通过考虑某个主题的主题词在其他主题上的边缘概率,重排该主题的前端单词列表。本文提出三种主题词重排策略:(1)使用标准差权重(standard deviation weight);(2)使用带有主题规模的标准差权重;(3)使用卡方检验(Chi SquareX~2)。本文针对LDA模型,在两个实际应用数据集上,首先验证这三种重排策略是否能够准确地过滤掉类停用词,然后通过单词侵入(word intrusion)任务验证这三种重排策略是否能够输出语义更相关的主题词。实验结果表明这三种重排策略能够输出更具代表性的主题词,使主题在语义上更具一致性和可解释性。
【图文】:

固定参数,数据集,博士学位论文,吉林大学


吉林大学博士学位论文法的 perplexity 值低于 MFVI 方法的 perplexity 值。在 WEBKB、NIPS上,MFVI 方法的 perplexity 值低于 HVG 方法的 perplexity 值。然而,它特别小。这些实验结果和之前的分析是不匹配的,,原因可能是 HVG 方法程导致了额外的偏差。

固定参数,数据集


(b)固定参数的情况下在NIPS数据集上的perplexity结果
【学位授予单位】:吉林大学
【学位级别】:博士
【学位授予年份】:2019
【分类号】:TP391.1;TP181

【相似文献】

相关期刊论文 前10条

1 苗义烽;周晓昭;;主观贝叶斯方法在列车占用丢失报警原因分析中的应用[J];铁路计算机应用;2014年12期

2 艾艳杰;;基于贝叶斯方法的比例数据分位数推断及其应用[J];散文百家(新语文活页);2017年01期

3 云连英;汪荣伟;;保费调整的贝叶斯方法[J];统计与决策;2006年05期

4 张渭彬;;应力与强度相关条件下产品可靠度的Bayes估计[J];强度与环境;1988年06期

5 张建国;;贝叶斯方法及其问题浅识[J];医学与哲学;1988年11期

6 王宏洲;引信的可靠性评定——贝叶斯方法和经验贝叶斯方法[J];现代引信;1989年02期

7 石国桢;;工程诊断和诊断中的贝叶斯方法[J];机械强度;1984年02期

8 邹亚娟;;贝叶斯方法在数据挖掘中的应用进展[J];科技致富向导;2014年14期

9 丁东洋;刘希阳;;风险分析中的稳健贝叶斯方法[J];内蒙古财经学院学报;2011年04期

10 丁东洋;周丽莉;;贝叶斯方法在污水处理收费研究中的应用[J];统计教育;2009年03期

相关会议论文 前10条

1 丁东洋;刘希阳;;风险分析中的稳健贝叶斯方法[A];2011年全国电子信息技术与应用学术会议论文集[C];2011年

2 David Z.D'Argenio;;贝叶斯方法在实验室研究向临床的转化以及辨识隐含亚群体中的应用(英文)[A];中国药理学会临床药理学专业委员会会议暨第十次全国临床药理学学术会议论文集[C];2007年

3 胡桂华;易跃明;林敏;;稀少项目子总体估计的贝叶斯方法——基于一个抽样审计问题的讨论[A];中国会计学会高等工科院校分会2008年学术年会(第十五届年会)暨中央在鄂集团企业财务管理研讨会论文集(下册)[C];2008年

4 杨丽;武海滨;李康;;无金标准诊断试验评价的贝叶斯方法及应用[A];2011年中国卫生统计学年会会议论文集[C];2011年

5 朱永生;;贝叶斯方法确定泊松变量的置信上限[A];中国物理学会高能物理分会第七届学术年会实验分会场论文集[C];2006年

6 王增忠;柳玉杰;施建刚;;建筑工程项目全寿命安全管理决策的贝叶斯方法[A];中国优选法统筹法与经济数学研究会第七届全国会员代表大会暨第七届中国管理科学学术年会论文集[C];2005年

7 马东辉;;ASReml在分子育种中的应用[A];第一届全国玉米生物学学术研讨会论文汇编[C];2015年

8 费斌军;陈勃;;疲劳强度参数概率分布的贝叶斯方法[A];新世纪 新机遇 新挑战——知识创新和高新技术产业发展(下册)[C];2001年

9 翟铎;李风华;;基于变分贝叶斯的水平阵模态分离[A];中国声学学会水声学分会2019年学术会议论文集[C];2019年

10 龚盛夏;黄乘利;;贝叶斯方法反演类地行星内部结构[A];中国地球物理2013——第二十五专题论文集[C];2013年

相关重要报纸文章 前1条

1 本报记者 计红梅;向机器理解人类行为迈出一小步[N];中国科学报;2019年

相关博士学位论文 前10条

1 迟晋进;变分推理及贝叶斯方法在主题模型中应用的研究[D];吉林大学;2019年

2 钱永青;结构化贝叶斯压缩感知技术及其应用研究[D];武汉大学;2013年

3 张少中;基于贝叶斯网络的知识发现与决策应用研究[D];大连理工大学;2003年

4 李小琳;面向智能数据处理的贝叶斯网络研究与应用[D];吉林大学;2005年

5 黄友平;贝叶斯网络研究[D];中国科学院研究生院(计算技术研究所);2005年

6 胡笑旋;贝叶斯网建模技术及其在决策中的应用[D];合肥工业大学;2006年

7 王红梅;保护隐私的贝叶斯网络学习研究[D];天津大学;2006年

8 董立岩;贝叶斯网络应用基础研究[D];吉林大学;2007年

9 周忠宝;基于贝叶斯网络的概率安全评估方法及应用研究[D];国防科学技术大学;2006年

10 李旭升;贝叶斯网络分类模型研究及其在信用评估中的应用[D];西南交通大学;2007年

相关硕士学位论文 前10条

1 张小圆;保险精算中风险保费的贝叶斯预测与统计分析[D];江西师范大学;2018年

2 万闯;基于贝叶斯Expectile模型的股指期货风险研究[D];湖南大学;2018年

3 任德鑫;中国大陆地区地震数据的空间贝叶斯建模[D];昆明理工大学;2018年

4 孙慕白;应用贝叶斯方法对柯萨奇病毒A组6型分子进化的研究[D];吉林大学;2018年

5 郑姝婷;基于贝叶斯网络的地铁列车制动系统可靠性分析[D];北京交通大学;2018年

6 马晓彤;基于贝叶斯网络的重特大交通事故影响研究[D];长安大学;2018年

7 周昱;基于贝叶斯网的高速公路隧道交通事故预测及应急预案研究[D];长安大学;2018年

8 盖迪;基于改进贝叶斯网络的变电站故障诊断的研究[D];东北石油大学;2018年

9 黄鹂;近似贝叶斯方法及其应用研究[D];苏州大学;2018年

10 刘康;贝叶斯滤波的概率似然乘积方法研究[D];昆明理工大学;2018年



本文编号:2657383

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2657383.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3e1df***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com