基于数据选择方法的分类器性能提高的研究
发布时间:2021-09-09 20:32
目前机器学习作为数据挖掘中一种重要的工具,其不只是对人的认知学习过程的探索,还包括对数据的分析处理。面对大量数据的挑战,目前一部分研究专注于机器学习算法的改进和开拓,另一部分研究人员则致力于样本数据的选择和数据集的缩减,这两方面研究工作是并行的。训练样本数据选择是机器学习的一个研究热点,通过对样本数据的有效选择,提取更具有信息量的样本,剔除冗余样本和噪声数据,从而提高训练样本质量,进而获得更好的学习性能。本文以分类器训练样本为研究对象,对分类器训练样本选择方法进行研究。(1)作者就目前存在的样本数据选择方法进行综述研究,对目前存在的方法从基于抽样的方法、基于聚类的方法、基于近邻分类规则的方法这三大类以及其他相关数据选择方法四个方面进行总结和分析对比,并对训练样本数据选择方法存在的问题和未来研究方向提出一些结论和展望。(2)为了提高神经网络分类器的性能,本文提出一种新的训练样本数据选择方法——基于K均值聚类的分段样本数据选择方法,利用该方法结合人工数据集和UCI标准数据集分别对BP、LVQ、ENN(Extension neural network)这三种常用的分类器进行实验研究,并验证了...
【文章来源】:华北水利水电大学河南省
【文章页数】:87 页
【学位级别】:硕士
【部分图文】:
Fisher线性判别原理示意图
3人工神经网络173人工神经网络3.1人工神经网络基本理论神经网络是分类技术的重要工具之一,近年来大量学者研究表明神经网络在未来有希望代替传统的基于统计学的分类技术。人工神经网络(ArtificialNeuralNetwork,ANN)是由大量简单的小单元组成的一种复杂的网络系统。其工作原理和组成结构是对大脑神经元网络功能的模拟,能够反映我们人脑的一些活动特征,人脑是复杂的,人工神经网络只是对其简单的抽象化和模仿,尚不能反映人脑全部的活动特征。近年来依照生物神经元网络进行模拟发展出了多种类型的人工神经网络,在大数据与人工智能发展火热的今天有着十分广泛的应用。3.1.1人工神经元人工神经元模型是由生物神经元抽象提炼出来的。神经元由轴突、树突、细胞体和突触构成,人脑由无数神经元互相连接构成的神经元网络来进行信息处理。其结构如下图3-1所示。图3-1生物神经元结构图Figure3-1Biologicalneuronstructure由神经元组成结构来看,神经元之间通过感知环境变化,进而产生连续的变化,并在其之间进行信息传递。ANN是由人工神经元这一基本单位组成的,是一种对生物神经元从数学角度出发的模拟,各神经元之间是独立的单元,可以对信息进行自学习和处理,同时各神经元又相互具有联系,根据各神经元反馈的信息进行结构的调整,具有自学习能力,人工神经网络结构模型如图3-2所示。
改进的可拓距离Fig.3-11Theimprovedextensiondistance(ED)
【参考文献】:
期刊论文
[1]基于集对分析和GA-BP神经网络的地下水埋深预测研究[J]. 陈笑,胡宏祥,戚王月,周婷,夏萍. 华北水利水电大学学报(自然科学版). 2019(04)
[2]基于LVQ神经网络的高压断路器机械故障诊断方法[J]. 马宏忠,徐艳,魏海增,刘勇业. 高压电器. 2019(08)
[3]一种新的样本选择算法及其在文本分类中的应用[J]. 万中英,王明文,左家莉,刘长红. 江西师范大学学报(自然科学版). 2019(01)
[4]基于模糊集对分析的京津冀水资源可持续利用评价[J]. 门宝辉,刘焕龙. 华北水利水电大学学报(自然科学版). 2018(04)
[5]基于余弦相似度的边界样本选择方法[J]. 李春利,柳振东,惠康华. 计算机与现代化. 2017(08)
[6]Multi Boost with ENN-based ensemble fault diagnosis method and its application in complicated chemical process[J]. 夏崇坤,苏成利,曹江涛,李平. Journal of Central South University. 2016(05)
[7]一种基于邻域样本密度的SVDD样本剪辑方法及其应用[J]. 张安安,郑萍,方琳,彭嵩松. 江西科学. 2014(06)
[8]融合互近邻和可信度的K-近邻分类算法[J]. 石鑫鑫,胡学钢,林耀进. 合肥工业大学学报(自然科学版). 2014(09)
[9]一种基于混合误差梯度下降算法的过程神经网络训练[J]. 许少华,宋美玲,许辰,朱新宁. 东北石油大学学报. 2014(04)
[10]考虑局部均值和类全局信息的快速近邻原型选择算法[J]. 李娟,王宇平. 自动化学报. 2014(06)
硕士论文
[1]基于样本选择的复杂分类问题研究[D]. 于光华.天津大学 2017
本文编号:3392741
【文章来源】:华北水利水电大学河南省
【文章页数】:87 页
【学位级别】:硕士
【部分图文】:
Fisher线性判别原理示意图
3人工神经网络173人工神经网络3.1人工神经网络基本理论神经网络是分类技术的重要工具之一,近年来大量学者研究表明神经网络在未来有希望代替传统的基于统计学的分类技术。人工神经网络(ArtificialNeuralNetwork,ANN)是由大量简单的小单元组成的一种复杂的网络系统。其工作原理和组成结构是对大脑神经元网络功能的模拟,能够反映我们人脑的一些活动特征,人脑是复杂的,人工神经网络只是对其简单的抽象化和模仿,尚不能反映人脑全部的活动特征。近年来依照生物神经元网络进行模拟发展出了多种类型的人工神经网络,在大数据与人工智能发展火热的今天有着十分广泛的应用。3.1.1人工神经元人工神经元模型是由生物神经元抽象提炼出来的。神经元由轴突、树突、细胞体和突触构成,人脑由无数神经元互相连接构成的神经元网络来进行信息处理。其结构如下图3-1所示。图3-1生物神经元结构图Figure3-1Biologicalneuronstructure由神经元组成结构来看,神经元之间通过感知环境变化,进而产生连续的变化,并在其之间进行信息传递。ANN是由人工神经元这一基本单位组成的,是一种对生物神经元从数学角度出发的模拟,各神经元之间是独立的单元,可以对信息进行自学习和处理,同时各神经元又相互具有联系,根据各神经元反馈的信息进行结构的调整,具有自学习能力,人工神经网络结构模型如图3-2所示。
改进的可拓距离Fig.3-11Theimprovedextensiondistance(ED)
【参考文献】:
期刊论文
[1]基于集对分析和GA-BP神经网络的地下水埋深预测研究[J]. 陈笑,胡宏祥,戚王月,周婷,夏萍. 华北水利水电大学学报(自然科学版). 2019(04)
[2]基于LVQ神经网络的高压断路器机械故障诊断方法[J]. 马宏忠,徐艳,魏海增,刘勇业. 高压电器. 2019(08)
[3]一种新的样本选择算法及其在文本分类中的应用[J]. 万中英,王明文,左家莉,刘长红. 江西师范大学学报(自然科学版). 2019(01)
[4]基于模糊集对分析的京津冀水资源可持续利用评价[J]. 门宝辉,刘焕龙. 华北水利水电大学学报(自然科学版). 2018(04)
[5]基于余弦相似度的边界样本选择方法[J]. 李春利,柳振东,惠康华. 计算机与现代化. 2017(08)
[6]Multi Boost with ENN-based ensemble fault diagnosis method and its application in complicated chemical process[J]. 夏崇坤,苏成利,曹江涛,李平. Journal of Central South University. 2016(05)
[7]一种基于邻域样本密度的SVDD样本剪辑方法及其应用[J]. 张安安,郑萍,方琳,彭嵩松. 江西科学. 2014(06)
[8]融合互近邻和可信度的K-近邻分类算法[J]. 石鑫鑫,胡学钢,林耀进. 合肥工业大学学报(自然科学版). 2014(09)
[9]一种基于混合误差梯度下降算法的过程神经网络训练[J]. 许少华,宋美玲,许辰,朱新宁. 东北石油大学学报. 2014(04)
[10]考虑局部均值和类全局信息的快速近邻原型选择算法[J]. 李娟,王宇平. 自动化学报. 2014(06)
硕士论文
[1]基于样本选择的复杂分类问题研究[D]. 于光华.天津大学 2017
本文编号:3392741
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3392741.html