当前位置:主页 > 科技论文 > 自动化论文 >

代价敏感粒计算若干方法的研究

发布时间:2020-08-26 20:59
【摘要】:代价敏感学习是数据挖掘和机器学习领域的一大挑战性问题,由于其在数据处理过程中考虑了现实的代价信息,因此具有较强的实际意义。粒计算是信息处理和知识发现的一种新的研究方法,它能把一个复杂的问题转化为若干比较简单的问题,从而有助于复杂问题的分析和解决。将代价敏感学习与粒计算相结合,是解决实用性问题的一个有效途径。本文主要基于邻域和粗糙集理论,对代价敏感粒计算的若干关键问题进行研究,主要的创新性研究成果概述如下:1.提出了一系列基于观测误差和可变代价的属性与属性值粒度同步选择的方法(为了方便,本文中有时简记“属性与属性值粒度”为“属性粒度”)。现有的代价敏感属性选择(在粗糙集中也称属性选择为属性约简)研究中只有极少数同时考虑了属性值粒度的选择,并且它们都只考虑了单重的粒度,也没有涉及到混合型数据和代价受限的情况。此外,已有的代价敏感学习中经常假设属性的测试代价和对象的误分类代价都是固定不变的,但现实中测试代价往往是可变的,它们和属性值的粒度之间存在着密切的关系,而误分类代价的可变性则跟所考虑的对象有关。本文根据现实情况,用属性值的观测误差的置信水平来衡量其粒度,充分考虑了该误差置信水平与测试代价和误分类代价这三者之间的关系,并讨论了数据处理中平均总代价(即论域中对象的总代价的平均值)的计算方法。在此基础上,以最小化平均总代价为目标,基于观测误差和可变代价分别研究了单粒度和多粒度的属性与属性值粒度同步选择的方法,具体如下:(1)针对混合型数据建立了一个基于误差置信水平的自适应邻域模型,并根据实际情况讨论了几种可变的测试代价和误分类代价函数;在此基础上分别针对测试代价受限和不受限两种情形提出了较为高效的单粒度的属性与属性值粒度同步选择的算法;在多个UCI数据集上的实验结果验证了算法的有效性。特别地,文中同时探讨了不同的代价背景对所选择的最优属性子集和最优属性值粒度的影响,从而为决策制定提供了可行的方案。(第3章)(2)考虑到实际应用中对不同的属性可能有不同的属性值粒度要求,首次探讨了多粒度的代价敏感的属性与属性值粒度同步选择的方法。首先建立了基于误差置信水平向量的邻域粗糙集模型,并给出了属性粒度对(即属性与属性值粒度的有序对)的重要度函数,从而提出了高效的多粒度的属性与属性值粒度同步选择的算法。实验结果验证了所提出的多粒度方法相比已有的单粒度方法在解决实际问题方面具有明显的优越性。(第4章)2.提出了邻域粗糙集中基于不一致邻域的属性约简方法。首先介绍了不一致邻域的概念,并探讨它跟邻域粗糙集中已有的基本概念的关系,从而得到上下近似集、正区域、边界区域等的新表示方式,再利用不一致邻域的性质分别设计了高效的代价不敏感和测试代价敏感的属性约简算法。通过理论和实验分析发现,相比运用传统的邻域,用不一致邻域来进行邻域粗糙集中的相关计算具有一定的优越性。(第5章)3.提出了决策粗糙集中代价敏感的属性约简方法。由于决策粗糙集中正区域有可能随着属性的增加反而缩小,这给该粗糙集中的属性约简带来了一定的困难。本文根据决策粗糙集的这一特点,在综合考虑决策代价和测试代价的基础上,建立了该粗糙集中代价敏感的属性约简方法的理论模型,特别是给出了代价敏感的属性子集重要度函数,并以最小化平均总代价为目标分别提出了回溯的和启发式的属性约简算法。实验结果验证了所提出算法的有效性。(第6章)综上所述,本文研究了代价敏感粒计算的若干关键问题。对于每个问题,分别建立了相应的理论模型,并提出了有效的算法,再做实验加以验证。该研究丰富了代价敏感粒计算的理论与方法体系,也为今后的研究工作奠定了重要基础。
【学位授予单位】:电子科技大学
【学位级别】:博士
【学位授予年份】:2018
【分类号】:TP181;TP311.13
【图文】:

平均运行时间,数据集,因子


属性约简算法(a) (b)图5-7 Ionosphere数据集上平均运行时间的比较接着,最优发现因子(FOF)和平均超标因子(AEF)的值如图5-12至图5-14所示.这两个指标值是通过比较本节所提出的算法和文献[139]中的回溯算法的结果来计算得到的,原因在于后者得到的一定是最优约简.从这3个图中可知,虽然在某些时候最优发现因子不够高,但是大部分的平均超标因子不超过0.2,所以我们的算法的91

平均运行时间,数据集,分类性能


电子科技大学博士学位论文(a) (b)图5-8 Sonar数据集上平均运行时间的比较(a) (b)图5-9 Wdbc数据集上平均运行时间的比较结果是可以接受的,该算法能在最小化总测试代价方面取得良好的效果.然后,基于10折交叉验证比较原始数据和由所提出的算法得到的约简数据的分类性能,其中分别采用了CART分类器和RBF核的SVM分类器,结果如图5-15至图5-20所示.由结果可知,该算法得到的约简数据大多数情况下能保持原始数据的分类性能,有时甚至能取得比原来高得多的分类精度.最后,我们探讨邻域半径 的取值大小对实验结果的影响. 一方面

平均运行时间,数据集,分类性能,约简


数据集上平均运行时间的比较(a) (b)图5-9 Wdbc数据集上平均运行时间的比较结果是可以接受的,该算法能在最小化总测试代价方面取得良好的效果.然后,基于10折交叉验证比较原始数据和由所提出的算法得到的约简数据的分类性能,其中分别采用了CART分类器和RBF核的SVM分类器,结果如图5-15至图5-20所示.由结果可知,该算法得到的约简数据大多数情况下能保持原始数据的分类性能,有时甚至能取得比原来高得多的分类精度.最后,我们探讨邻域半径 的取值大小对实验结果的影响. 一方面

【相似文献】

相关期刊论文 前10条

1 马建春;张昊亮;马灶亮;陈吉生;;基于粗糙集理论的中药复方专利防治糖尿病药证规律研究[J];今日药学;年期

2 黄爱萍;黄凤英;;基于覆盖粗糙集的超图连通性[J];数码设计;2016年02期

3 刘艳芳;陈雪云;;关系粗糙集的邻域拟阵结构研究[J];数码设计;2016年02期

4 汪小燕;申元霞;;基于粒度矩阵的程度多粒度粗糙集粒度约简[J];系统工程与电子技术;2016年12期

5 薛占熬;司小朦;王楠;朱泰隆;;基于最小/最大描述的多粒度覆盖粗糙直觉模糊集模型[J];计算机科学;2017年01期

6 段云艳;吕跃进;谢凤平;;优势关系下多粒度粗糙集排序方法及其应用[J];计算机工程与应用;2017年01期

7 胡成祥;赵国柱;;优势关系多粒度粗糙集中近似集动态更新方法[J];中国科学技术大学学报;2017年01期

8 汪小燕;沈家兰;申元霞;;基于加权粒度和优势关系的程度多粒度粗糙集[J];山东大学学报(理学版);2017年03期

9 钟诚;李金海;;组合多粒度粗糙集及其在教学评价中的应用[J];数码设计;2017年01期

10 吴汉卿;吴缓缓;杨莹莹;纪霞;;基于粗糙集的大学生学习与就业关系分析[J];计算机技术与发展;2017年05期

相关会议论文 前10条

1 尹宗成;;粗糙集理论在我国粮食产量预测中的应用[A];现代农业理论与实践——安徽现代农业博士科技论坛论文集[C];2007年

2 刘碧森;钟守铭;陈华富;;基于支持向量机与粗糙集理论的信息处理[A];第二届全国信息获取与处理学术会议论文集[C];2004年

3 李雄;李胜利;徐宗昌;;基于粗糙集理论的状态监测与故障诊断(英文)[A];第三届全国信息获取与处理学术会议论文集[C];2005年

4 卓明;王丽珍;谭旭;;基于粗糙集近似集扩展的规则提取算法[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年

5 葛丽;傅彦;;粗糙集在科学数据属性约简中的应用[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年

6 孙亮;杨飞;于建均;陈梅莲;;一种基于指数粗糙集合的变精度控制器应用研究[A];第25届中国控制会议论文集(下册)[C];2006年

7 陈钉均;刘熠;李涵;吴开腾;;变精度覆盖粗糙集的新型算子研究[A];中国运筹学会模糊信息与模糊工程分会第五届学术年会论文集[C];2010年

8 刘庆珍;蔡金锭;;基于粗糙集理论的电力电子电路故障诊断[A];第十六届电工理论学术年会论文集[C];2004年

9 黄伟;赵寅邦;陈乔生;王俊凯;;基于改进遗传算法和粗糙集的变压器故障诊断[A];2015年全国智能电网用户端能源管理学术年会论文集[C];2015年

10 王旭阳;王彤;李明;;基于粗糙集理论的分类规则挖掘方法[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年

相关重要报纸文章 前2条

1 本报记者 李智 通讯员 梁宪生;零的突破[N];山西经济日报;2001年

2 重庆邮电学院党委书记徐仲伟 院长 聂能;发挥学科优势 打造信息平台[N];科技日报;2005年

相关博士学位论文 前10条

1 廖淑娇;代价敏感粒计算若干方法的研究[D];电子科技大学;2018年

2 黎文善(LE VAN THIEN);基于覆盖的概率粗糙集和L-模糊变精度粗糙集研究[D];武汉大学;2015年

3 王丽娜;基于阴影集和粗糙集的模糊聚类算法研究与应用[D];南京航空航天大学;2016年

4 谭天乐;基于粗糙集的过程建模、控制与故障诊断[D];浙江大学;2003年

5 乔斌;粗糙集理论分层递阶约简算法的研究[D];浙江大学;2003年

6 何亚群;基于粗糙集的智能决策理论与应用研究[D];南京航空航天大学;2005年

7 马玉良;知识获取中的Rough Sets理论及其应用研究[D];浙江大学;2005年

8 张勇;粗糙集—神经网络智能系统在浮选过程中的应用研究[D];大连理工大学;2006年

9 王加阳;面向海量数据的粗糙集理论与方法研究[D];中南大学;2005年

10 乔梅;基于粗糙集和数据库技术的知识发现与推理方法研究[D];天津大学;2005年

相关硕士学位论文 前10条

1 韩志伟;基于聚类与粗糙集的配电网故障诊断研究[D];电子科技大学;2018年

2 李倩倩;粗糙集的最优近似及其在约简中的应用[D];山西师范大学;2017年

3 孟建钊;基于压缩感知的汇率预测与粗糙集加权的聚类研究[D];华南理工大学;2017年

4 张宁;基于邻域粗糙集的属性约简算法研究[D];湖南大学;2017年

5 靳永飞;优势关系粗糙集的扩展模型及快速约简方法[D];河北大学;2017年

6 于群;优势关系下基于论域递减的属性约简方法[D];河北大学;2017年

7 姚红娟;基于局部粗糙集的三支决策模型[D];长安大学;2017年

8 王洁;基于粒计算的公交客流量分析与预测研究[D];杭州电子科技大学;2017年

9 程新洪;基于粗糙集与多元回归的公交客流预测模型研究[D];杭州电子科技大学;2017年

10 潘晓;基于粗糙集的证据理论及其在网络证据融合中的应用[D];山东师范大学;2017年



本文编号:2805690

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2805690.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户fdb03***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com