分布式环境下差异性提升相关向量机算法研究与应用
发布时间:2022-08-02 10:50
相关向量机(Relevance Vector Machine,RVM)是一种基于稀疏贝叶斯理论的机器学习算法。该算法十分擅长处理小规模数据问题,由于其优秀的表现,已经应用于图像处理、故障诊断等许多领域。然而,RVM对数据的处理能力还有一些不足,例如在训练样本规模较大的数据时,它会消耗过多的内存和时间,引起学习效率下降;面对有噪声的数据或者样本不均衡的数据时,学习性能表现次优。这些存在的不足,特别是数据规模问题使得RVM的发展受到了限制。针对这些问题,本课题首先利用混合采样、噪声检测和AdaBoost方法提升了RVM在小规模数据集(不均衡、噪声)上的分类精度;其次,结合分布式计算、集成学习和差异性度量对前一个研究成果进行拓展,提升了RVM在大规模数据集(均衡、不均衡)上的分类性能。本文的主要工作包括:(1)针对小规模数据集中不均衡样本和噪声样本对RVM分类的影响,在数据预处理阶段,采用了基于随机欠采样和自适应样本合成采样的混合采样方法减弱了样本间的不均衡性。随后利用RVM概率型输出特性,提出了一种用以识别噪声的检测方法。接着将该检测方法引入AdaBoostRVM中,提出基于噪声检测的Ad...
【文章页数】:72 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.2.1 相关向量机研究现状
1.2.2 分布式平台研究现状
1.3 研究内容和组织结构
1.3.1 本文的研究内容
1.3.2 本文的组织结构
第2章 基于噪声检测的AdaBoostRVM分类算法
2.1 引言
2.2 数据预处理
2.2.1 随机欠采样
2.2.2 ADASYN过采样
2.2.3 混合采样
2.3 基于RVM特性的噪声检测方法
2.3.1 RVM特性
2.3.2 NDRF方法
2.4 基于噪声检测的AdaBoostRVM算法
2.5 实验
2.5.1 实验数据集与参数设置
2.5.2 模型评价指标
2.5.3 实验结果与分析
2.6 本章小结
第3章 基于差异性度量的分布式RVM集成算法
3.1 引言
3.2 分布式RVM集成算法设计
3.3 基于差异性度量的RVM多分类器组合策略
3.4 Spark平台下DE-RVM算法的实现
3.4.1 Spark计算模型
3.4.2 MapReduce阶段
3.4.3 DE-RVM实现
3.5 实验
3.5.1 实验数据集与参数设置
3.5.2 运行环境
3.5.3 实验结果与分析
3.6 本章小结
第4章 基于DE-RVM的桥梁裂缝损伤识别
4.1 引言
4.2 基于光纤光栅的桥梁结构监测系统
4.2.1 光纤光栅传感系统
4.2.2 系统架构及实现
4.3 桥梁裂缝损伤识别应用
4.3.1 数据描述
4.3.2 实验结果与分析
4.4 本章小结
第5章 总结与展望
5.1 总结
5.2 展望
致谢
参考文献
在读期间取得的学术成果
在读期间参与的基金和项目
【参考文献】:
期刊论文
[1]基于振动信号样本熵和相关向量机的万能式断路器分合闸故障诊断[J]. 孙曙光,于晗,杜太行,王景芹,赵黎媛. 电工技术学报. 2017(07)
[2]经验模式分解与代价敏感支持向量机在癫痫脑电信号分类中的应用[J]. 李冬梅,张洋,杨日东,陈子怡,田翔华,董楠,尔西丁·买买提,周毅. 生物医学工程研究. 2017(01)
[3]基于信息熵的RVM-AdaBoost组合分类器[J]. 翟夕阳,王晓丹,李睿,贾琪. 计算机工程与应用. 2018(05)
[4]基于开源生态系统的大数据平台研究[J]. 雷军,叶航军,武泽胜,张鹏,谢龙,何炎祥. 计算机研究与发展. 2017(01)
[5]MapReduce大数据处理平台与算法研究进展[J]. 宋杰,孙宗哲,毛克明,鲍玉斌,于戈. 软件学报. 2017(03)
[6]基于支持向量机回归组合模型的中长期降温负荷预测[J]. 王宁,谢敏,邓佳梁,刘明波,李嘉龙,王一,刘思捷. 电力系统保护与控制. 2016(03)
[7]贝叶斯机器学习前沿进展综述[J]. 朱军,胡文波. 计算机研究与发展. 2015(01)
[8]通用集成学习算法的构造[J]. 付忠良. 计算机研究与发展. 2013(04)
[9]不平衡多分类问题的连续AdaBoost算法研究[J]. 付忠良. 计算机研究与发展. 2011(12)
[10]稀疏贝叶斯模型与相关向量机学习研究[J]. 杨国鹏,周欣,余旭初. 计算机科学. 2010(07)
本文编号:3668383
【文章页数】:72 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.2.1 相关向量机研究现状
1.2.2 分布式平台研究现状
1.3 研究内容和组织结构
1.3.1 本文的研究内容
1.3.2 本文的组织结构
第2章 基于噪声检测的AdaBoostRVM分类算法
2.1 引言
2.2 数据预处理
2.2.1 随机欠采样
2.2.2 ADASYN过采样
2.2.3 混合采样
2.3 基于RVM特性的噪声检测方法
2.3.1 RVM特性
2.3.2 NDRF方法
2.4 基于噪声检测的AdaBoostRVM算法
2.5 实验
2.5.1 实验数据集与参数设置
2.5.2 模型评价指标
2.5.3 实验结果与分析
2.6 本章小结
第3章 基于差异性度量的分布式RVM集成算法
3.1 引言
3.2 分布式RVM集成算法设计
3.3 基于差异性度量的RVM多分类器组合策略
3.4 Spark平台下DE-RVM算法的实现
3.4.1 Spark计算模型
3.4.2 MapReduce阶段
3.4.3 DE-RVM实现
3.5 实验
3.5.1 实验数据集与参数设置
3.5.2 运行环境
3.5.3 实验结果与分析
3.6 本章小结
第4章 基于DE-RVM的桥梁裂缝损伤识别
4.1 引言
4.2 基于光纤光栅的桥梁结构监测系统
4.2.1 光纤光栅传感系统
4.2.2 系统架构及实现
4.3 桥梁裂缝损伤识别应用
4.3.1 数据描述
4.3.2 实验结果与分析
4.4 本章小结
第5章 总结与展望
5.1 总结
5.2 展望
致谢
参考文献
在读期间取得的学术成果
在读期间参与的基金和项目
【参考文献】:
期刊论文
[1]基于振动信号样本熵和相关向量机的万能式断路器分合闸故障诊断[J]. 孙曙光,于晗,杜太行,王景芹,赵黎媛. 电工技术学报. 2017(07)
[2]经验模式分解与代价敏感支持向量机在癫痫脑电信号分类中的应用[J]. 李冬梅,张洋,杨日东,陈子怡,田翔华,董楠,尔西丁·买买提,周毅. 生物医学工程研究. 2017(01)
[3]基于信息熵的RVM-AdaBoost组合分类器[J]. 翟夕阳,王晓丹,李睿,贾琪. 计算机工程与应用. 2018(05)
[4]基于开源生态系统的大数据平台研究[J]. 雷军,叶航军,武泽胜,张鹏,谢龙,何炎祥. 计算机研究与发展. 2017(01)
[5]MapReduce大数据处理平台与算法研究进展[J]. 宋杰,孙宗哲,毛克明,鲍玉斌,于戈. 软件学报. 2017(03)
[6]基于支持向量机回归组合模型的中长期降温负荷预测[J]. 王宁,谢敏,邓佳梁,刘明波,李嘉龙,王一,刘思捷. 电力系统保护与控制. 2016(03)
[7]贝叶斯机器学习前沿进展综述[J]. 朱军,胡文波. 计算机研究与发展. 2015(01)
[8]通用集成学习算法的构造[J]. 付忠良. 计算机研究与发展. 2013(04)
[9]不平衡多分类问题的连续AdaBoost算法研究[J]. 付忠良. 计算机研究与发展. 2011(12)
[10]稀疏贝叶斯模型与相关向量机学习研究[J]. 杨国鹏,周欣,余旭初. 计算机科学. 2010(07)
本文编号:3668383
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3668383.html