结合稀疏贝叶斯学习和混合高斯的主动学习算法研究
发布时间:2021-08-30 21:55
在现实生活中,人们可以很容易地获取大量的数据,但是通常其中大部分数据是没有样本标签的。传统的监督学习算法仅使用少部分有标签的数据进行训练,由于训练样本规模小,信息不完备,很难达到较好的预测效果。如果对没有样本标签的样本进行人工标注,又需要消耗大量的时间和精力,甚至在有些情况下根本无法完成对大量样本的标注。针对这个现实问题,传统的监督学习算法无法提出一个准确、高效的解决方案,主动学习算法却可以解决这个问题。利用主动学习的专家标注机制可以不断选择信息量大的样本进行标注扩充样本集,最终获得较优的预测模型。相关向量机是一种典型的稀疏贝叶斯学习模型,其具有很强的稀疏性,提供更灵活的核函数选择以及概率化的输出,并且也有着不亚于其他机器学习方法的预测性能。因此,本文主要结合相关向量机进行主动学习算法的研究,使用混合高斯探索样本的分布特征,基于马氏距离构造结合样本分布特性的混合高斯核函数,改进经典的相关向量机模型,提出基于混合高斯核的直推式相关向量机算法,并将其应用到主动学习框架中,定义一种新的主动学习算法。本文的主要研究工作如下:(1)为了在学习过程中充分考虑样本的分布特性,利用混合高斯探索样本的分...
【文章来源】:武汉理工大学湖北省 211工程院校 教育部直属院校
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
欧氏距离和马氏距离对比图
图 2.2 不同核函数的 KTA 值对比综上所述,混合高斯核函数考虑了样本的分布特性,将样本看作是一系列分布的叠加,基于马氏距离分析了样本关于各个高斯分布的联系,能很好地数据样本的特征,并将这些特性通过核函数的映射带入到高维特征空间中了核向量与目标向量之间的相似度,因此,混合高斯核具有较强的抓取样本的能力,利用核排列方法评估出混合高斯核函数具有较强的性能。实验与分析仿真数据集为了进一步地验证混合高斯核函数的有效性,使用仿真数据集 TwoMoon实验,将混合高斯核函数应用到 RVM 算法中,和高斯核函数进行对比,使法的评价标准(准确率)对比两种核函数的性能。为了在不同的数据场景下充分验证使用混合高斯核函数的 RVM 算法的
用高斯核和混合高斯核进行 RVM 算法的训练,根据得到的 RVM 模型对整个数据集进行预测,比较预测结果的准确性。实验一的结果如图 2.3 所示,其中图(a)显示使用高斯核函数的预测结果,图(b)显示使用混合高斯核函数的预测结果。图中虚线代表预测模型的决策边界,黑色大圆圈表示相关向量。从图中可以看出,使用高斯核函数得到的预测结果准确率为 96.29%,使用混合高斯核函数得到的预测结果准确率为 96.89%,略高于高斯核函数。
【参考文献】:
期刊论文
[1]基于遗传规划和主动学习的本体实例匹配[J]. 孙煜飞,马良荔,解嘉宇. 计算机应用研究. 2018(05)
[2]基于双层采样主动学习的社交网络虚假用户检测方法[J]. 谭侃,高旻,李文涛,田仁丽,文俊浩,熊庆宇. 自动化学报. 2017(03)
[3]动态神经网络分类器主动学习算法及其智能控制应用[J]. 任红格,李冬梅,李福进. 计算机应用与软件. 2016(07)
[4]一种基于主动学习的恶意代码检测方法[J]. 毛蔚轩,蔡忠闽,童力. 软件学报. 2017(02)
[5]基于高斯过程模型的异常检测算法[J]. 于冰洁,夏战国,王久龙. 计算机工程与设计. 2016(04)
[6]基于相关系数的决策树优化算法[J]. 董跃华,刘力. 计算机工程与科学. 2015(09)
[7]主动特征学习及其在盲图像质量评价中的应用[J]. 高飞,高新波. 计算机学报. 2014(10)
[8]基于特征子集区分度与支持向量机的特征选择算法[J]. 谢娟英,谢维信. 计算机学报. 2014(08)
[9]一种新的基于SVM和主动学习的图像检索方法[J]. 彭晏飞,尚永刚,王德建. 计算机工程与科学. 2014(07)
[10]基于SVM主动学习技术的PU文本分类[J]. 富震. 计算技术与自动化. 2014(01)
博士论文
[1]快速块稀疏贝叶斯学习算法的理论与应用[D]. 刘本源.国防科学技术大学 2015
[2]相关向量机多分类算法的研究与应用[D]. 柳长源.哈尔滨工程大学 2013
[3]结合主动学习的视觉场景理解[D]. 姚拓中.浙江大学 2011
硕士论文
[1]基于主动学习的微博情感分析方法研究[D]. 关雅夫.吉林大学 2017
本文编号:3373569
【文章来源】:武汉理工大学湖北省 211工程院校 教育部直属院校
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
欧氏距离和马氏距离对比图
图 2.2 不同核函数的 KTA 值对比综上所述,混合高斯核函数考虑了样本的分布特性,将样本看作是一系列分布的叠加,基于马氏距离分析了样本关于各个高斯分布的联系,能很好地数据样本的特征,并将这些特性通过核函数的映射带入到高维特征空间中了核向量与目标向量之间的相似度,因此,混合高斯核具有较强的抓取样本的能力,利用核排列方法评估出混合高斯核函数具有较强的性能。实验与分析仿真数据集为了进一步地验证混合高斯核函数的有效性,使用仿真数据集 TwoMoon实验,将混合高斯核函数应用到 RVM 算法中,和高斯核函数进行对比,使法的评价标准(准确率)对比两种核函数的性能。为了在不同的数据场景下充分验证使用混合高斯核函数的 RVM 算法的
用高斯核和混合高斯核进行 RVM 算法的训练,根据得到的 RVM 模型对整个数据集进行预测,比较预测结果的准确性。实验一的结果如图 2.3 所示,其中图(a)显示使用高斯核函数的预测结果,图(b)显示使用混合高斯核函数的预测结果。图中虚线代表预测模型的决策边界,黑色大圆圈表示相关向量。从图中可以看出,使用高斯核函数得到的预测结果准确率为 96.29%,使用混合高斯核函数得到的预测结果准确率为 96.89%,略高于高斯核函数。
【参考文献】:
期刊论文
[1]基于遗传规划和主动学习的本体实例匹配[J]. 孙煜飞,马良荔,解嘉宇. 计算机应用研究. 2018(05)
[2]基于双层采样主动学习的社交网络虚假用户检测方法[J]. 谭侃,高旻,李文涛,田仁丽,文俊浩,熊庆宇. 自动化学报. 2017(03)
[3]动态神经网络分类器主动学习算法及其智能控制应用[J]. 任红格,李冬梅,李福进. 计算机应用与软件. 2016(07)
[4]一种基于主动学习的恶意代码检测方法[J]. 毛蔚轩,蔡忠闽,童力. 软件学报. 2017(02)
[5]基于高斯过程模型的异常检测算法[J]. 于冰洁,夏战国,王久龙. 计算机工程与设计. 2016(04)
[6]基于相关系数的决策树优化算法[J]. 董跃华,刘力. 计算机工程与科学. 2015(09)
[7]主动特征学习及其在盲图像质量评价中的应用[J]. 高飞,高新波. 计算机学报. 2014(10)
[8]基于特征子集区分度与支持向量机的特征选择算法[J]. 谢娟英,谢维信. 计算机学报. 2014(08)
[9]一种新的基于SVM和主动学习的图像检索方法[J]. 彭晏飞,尚永刚,王德建. 计算机工程与科学. 2014(07)
[10]基于SVM主动学习技术的PU文本分类[J]. 富震. 计算技术与自动化. 2014(01)
博士论文
[1]快速块稀疏贝叶斯学习算法的理论与应用[D]. 刘本源.国防科学技术大学 2015
[2]相关向量机多分类算法的研究与应用[D]. 柳长源.哈尔滨工程大学 2013
[3]结合主动学习的视觉场景理解[D]. 姚拓中.浙江大学 2011
硕士论文
[1]基于主动学习的微博情感分析方法研究[D]. 关雅夫.吉林大学 2017
本文编号:3373569
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3373569.html