基于高斯过程混合的分类模型
本文选题:高斯过程 + 混合模型 ; 参考:《华东师范大学》2017年硕士论文
【摘要】:在贝叶斯非参数框架中,高斯过程是一种常用且功能强大的建模工具,被广泛应用于分类和回归问题中。为了提高高斯过程的数据建模能力和降低模型训练的计算复杂度,基于高斯过程混合的模型被相继提出。然而,这些已有的模型都是基于高斯过程回归模型,通常用来处理回归问题。在本文中,我们提出了一个新的基于无限高斯过程混合的分类模型(infinite mixtures of Gaussian processes based classification model,MGPC)。新的模型采用 logistic 函数作为似然,使得输出变量能够表示数据点属于正负类别的概率。因此,MGPC更适用于分类问题。混合权重服从狄利克雷过程(Dirichlet process,DP),模型具有建模无限多个混合成分的能力。MGPC采用完全贝叶斯的建模方式,而logistic似然函数以及DP的引入导致模型的后验分布难以求解。我们在变分推理的框架下,推导了所有潜变量的近似后验分布的更新算法。为了算法的可行性,我们采用线性高斯过程模型建模每个混合成分,它是高斯过程的一种等价的参数化表达,输出变量之间具有条件独立性。我们使用变分期望最大算法优化模型的超参数。在多个真实世界数据集上的实验结果显示,在与五种常用模型的比较中,MGPC取得了更好的分类性能。我们从多个角度出发分析实验结果,得到了不同于以往的结论。在单一高斯过程的分类和回归模型的比较中,两者性能没有明显差距。而MGPC的性能则显著地优于基于高斯过程混合的回归模型。最后,我们讨论了近似后验分布的截断水平对模型性能的影响,并通过实验验证了我们的分析。同时,实验结果也表明了 MGPC取得更好分类性能的潜力。
[Abstract]:In Bayesian nonparametric framework, Gao Si process is a common and powerful modeling tool, which is widely used in classification and regression problems. In order to improve the data modeling ability of Gao Si process and reduce the computational complexity of model training, the hybrid model based on Gao Si process has been proposed one after another. However, these existing models are based on Gao Si process regression models, which are usually used to deal with regression problems. In this paper, we propose a new classification model (infinite mixtures of Gaussian processes based classification model based on infinite Gao Si process. In the new model, the logistic function is used as the likelihood function, which enables the output variables to represent the probability that the data points belong to the positive and negative categories. Therefore, MGPC is more suitable for classification. The mixed weight is derived from the Dirichlet process DP. The model has the ability to model infinite mixed components. MGPC adopts a complete Bayesian modeling method. However, the introduction of logistic likelihood function and DP makes it difficult to solve the posteriori distribution of the model. In the framework of variational reasoning, we derive an algorithm for updating the approximate posterior distribution of all latent variables. For the feasibility of the algorithm, we use the linear Gao Si process model to model each mixed component, which is an equivalent parameterized expression of the Gao Si process, and the output variables are conditional independent. We use the variational expectation maximum algorithm to optimize the superparameters of the model. Experimental results on several real-world datasets show that MGPC achieves better classification performance compared with five commonly used models. We analyze the experimental results from many angles and get different conclusions. There is no significant difference between the classification and regression models of a single Gao Si process. The performance of MGPC is significantly better than that of mixed regression model based on Gao Si process. Finally, we discuss the effect of the truncation level of the approximate posterior distribution on the performance of the model, and verify our analysis by experiments. At the same time, the experimental results show the potential of MGPC to achieve better classification performance.
【学位授予单位】:华东师范大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP18
【相似文献】
相关期刊论文 前10条
1 魏三喜;;基于高斯过程的多元分类方法[J];信息技术;2012年06期
2 吕胜尚;;关于高斯过程的几个问题[J];西北电讯工程学院学报;1986年02期
3 喻鑫;柳健;田金文;;基于高斯过程的点匹配方法[J];华中科技大学学报(自然科学版);2007年12期
4 董晓慧;柴桂荣;孟宪春;;一种应用稀疏高斯过程回归模型的半监督分类算法[J];电脑知识与技术;2010年28期
5 傅启明;刘全;伏玉琛;周谊成;于俊;;一种高斯过程的带参近似策略迭代算法[J];软件学报;2013年11期
6 李宏伟;刘扬;卢汉清;方亦凯;;结合半监督核的高斯过程分类[J];自动化学报;2009年07期
7 黄丽平;孙永雄;申晨;;用基于中值滤波的高斯过程预测3G网络性能[J];计算机工程与应用;2013年02期
8 夏战国;夏士雄;蔡世玉;万玲;;类不均衡的半监督高斯过程分类算法[J];通信学报;2013年05期
9 何志昆;刘光斌;赵曦晶;王明昊;;高斯过程回归方法综述[J];控制与决策;2013年08期
10 刘辉;白峰杉;;基于混合高斯过程模型的高光谱图像分类算法[J];高校应用数学学报A辑;2010年04期
相关会议论文 前5条
1 刘信恩;肖世富;莫军;;用于不确定性分析的高斯过程响应面模型设计点选择方法研究[A];中国计算力学大会'2010(CCCM2010)暨第八届南方计算力学学术会议(SCCM8)论文集[C];2010年
2 刘冬;张清华;;基于高斯过程的精密卫星钟差加密[A];第二届中国卫星导航学术年会电子文集[C];2011年
3 李雅芹;杨慧中;;一种基于仿射传播聚类和高斯过程的多模型建模方法[A];2009中国过程系统工程年会暨中国mes年会论文集[C];2009年
4 赵级汉;张国敬;姜龙;魏巍;;基于叠加高斯过程的数字噪声产生方法FPGA实现[A];第二十四届全国空间探测学术交流会论文摘要集[C];2011年
5 何志昆;刘光斌;姚志成;赵曦晶;;基于高斯过程回归的FOG标度因数温度漂移建模新方法[A];第25届中国控制与决策会议论文集[C];2013年
相关博士学位论文 前7条
1 王建民;矿山边坡变形监测数据的高斯过程智能分析与预测[D];太原理工大学;2016年
2 赵静;基于高斯过程的动态系统研究[D];华东师范大学;2016年
3 潘伟;基于高斯过程的高炉炼铁过程辨识与预测[D];浙江大学;2012年
4 贺建军;基于高斯过程模型的机器学习算法研究及应用[D];大连理工大学;2012年
5 夏战国;基于高斯过程的提升机轴承性能评测方法研究[D];中国矿业大学;2013年
6 赵伟;复杂工程结构可靠度分析的高斯过程动态响应面方法研究[D];广西大学;2014年
7 房晟辰;基于高斯过程回归及Trust-Tech的短期风电功率预测方法[D];天津大学;2016年
相关硕士学位论文 前10条
1 李红丽;回归分析中的贝叶斯推断技术的研究[D];江南大学;2015年
2 李励耘;基于高斯过程的抓取规划方法研究[D];哈尔滨工业大学;2015年
3 王雪茹;基于高斯过程的风电机组部件建模与监测研究[D];华北电力大学;2015年
4 于立鑫;基于高斯过程—差异进化算法的隧道施工多元信息反分析研究[D];大连海事大学;2015年
5 戈财若;基于高斯过程的高光谱图像分类算法研究[D];东华理工大学;2015年
6 张栋;基于在线学习高斯过程有杆泵油井动态液面建模方法研究[D];东北大学;2014年
7 王奉伟;改进的局部均值分解和高斯过程在变形监测数据处理中的应用研究[D];东华理工大学;2016年
8 曹瑜;基于高斯过程的非线性不确定延迟系统的模型预测控制[D];华中科技大学;2014年
9 张莉萍;基于广义高斯过程回归的函数型数据分析[D];东南大学;2016年
10 王欢;基于逆高斯过程的退化数据分析与试验设计[D];东南大学;2016年
,本文编号:2055409
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/2055409.html