不确定性信息处理的优势关系粗糙集方法研究
本文关键词:不确定性信息处理的优势关系粗糙集方法研究
更多相关文章: 数据挖掘 粗糙集 优势关系 不确定性 变精度模型 自主式学习 客户价值计价
【摘要】:由于客观世界本身所具有的复杂性、不稳定性和人们对其认识存在不完全性,在数据采集、录入、表述、编辑、处理、分析等过程中存在着各种误差.此外,在概念的定性与定量转换过程中会导致随机、模糊、未确知等不确定性数据产生,这些现象普遍存在于金融、军事、经济、商业、工业控制、电信等诸多实际领域.数据的不确定性往往会使得数据挖掘的结果不可靠,甚至出现错误的结果.因此,对不确定性数据处理的理论和应用研究受到了越来越广泛的重视,并已成为智能信息处理的重要研究内容.粗糙集理论具有以确定的方法处理具有不一致、不精确和不完备等不确定性信息的能力,近年来已成为备受关注的新型智能信息处理方法.为了处理具有连续属性和优势关系的信息系统,Salvatore Greco和Roman Slowinski等学者提出了优势关系粗糙集理论.优势关系粗糙集理论以优势关系代替了经典粗糙集的不可分辨关系,更好地满足了描述实际问题中某些属性具有偏序关系和连续属性的需要.由于优势关系粗糙集可以有效处理等价关系和具有偏序关系的决策信息系统,现已成为经典粗糙集的一个很重要的扩展理论模型.它在投资风险评估、客户关系管理、地震震级评价、军事目标威胁评估、动车舒适度评价等方面己得到了成功应用.目前,优势关系粗糙集对不确定性信息的处理主要采用变精度模型,科学合理的变精度模型和变精度阈值的获取是其关键,且对其他不确定性信息处理方法的研究和在实际领域的应用研究也显得非常急迫.本文采用优势关系粗糙集研究不确定性信息处理问题,从变精度模型、不一致信息系统的一致化转换方法、数据驱动的自主式学习等角度进行理论研究,并将理论研究成果应用于解决电信客户价值评价等实际问题.归纳起来,本文的主要内容和创新性研究成果包括以下几个方面:(1)提出了一种基于包含度和支持度的变精度优势关系粗糙集模型,克服了已有模型的不足,对信息系统中的原始信息利用更加充分.通过对现有变精度优势关系粗糙集的两个主要模型VC-DRSA和VP-DRSA的分析,发现由于决策信息系统中不一致对象的存在.VC-DRSA模型在计算对象是否进入下近似时会出现矛盾的结果.而对于VP-DRSA模型,上并集或下并集边缘上的对象很难进入下近似,从而影响了对信息的充分利用.在分析了以上两种变精度模型对不一致信息处理不足的基础上,提出了一种基于包含度和支持度的变精度优势关系粗糙集模型,分析了该模型所具有的数学性质,并证明了用该模型所得到的下近似是VC-DRSA和VP-DRSA下近似的并集,上近似是这两种模型上近似的交集.这使得包含在下近似的对象更多和包含在上近似的对象变少,不确定性区域减小,近似分类质量得到提高.从而在一定程度上降低了信息系统在处理过程中的不确定性.学生综合评价的实例分析表明该模型能更加充分地利用信息系统所提供的有用信息.并通过在UCI等数据集上的实验验证了该模型有助于分类性能的提高.(第2章)(2)提出了一种将优势关系下的不一致信息系统进行一致化转换的算法,实现了一种处理不一致信息系统的新方法.对优势关系信息系统中对象的向下不一致性和向上不一致性进行了度量,进而提出了对象整体不一致性概念,并给出了对象整体不一致性的三种度量准则,分别表示为α、ε和μ.在此基础上,提出了一种将优势关系下的不一致信息系统转换为一致信息系统的算法TIPStoC.该算法根据对象整体不一致性的大小,采用迭代方法每次将最不一致对象删除,直到信息系统变为一致.之后,在一致信息系统的基础上提取确定的决策规则进行分类预测.这是一种处理不一致信息系统的新方法,与其他方法相比的突出特点是能有效地将优势关系信息系统中的不一致信息识别出来.因此,该方法也可有效地处理军事和信息安全等领域中的离群值或孤立点的检测.(第3章)(3)提出了一种数据驱动的优势关系粗糙集自主式学习方法,有效地避免了知识获取过程中对先验知识的依赖,增强了优势关系粗糙集对不一致信息处理的适应性.在对优势关系决策信息系统的整体确定性、最大整体确定性、整体不确定性、最小整体不确定性特征进行度量的基础上,提出了度量各决策类集的最大确定性的准则和计算算法.并以各决策类集的最大确定性作为该决策类集的变精度阈值提出了一种数据驱动的自主式学习方法SL-DRSA该方法以各决策类集的最大确定性作为该类集的变精度阈值进行规则获取,避免了其他变精度模型对阈值选取的随意性问题和不断尝试而带来的计算复杂性问题.通过在UCI等数据集上的实验表明,该方法可实现根据数据集本身特性自主地确定各决策类集的变精度阈值,且表现出了较好的分类效果,特别是在不一致性较高的数据集中体现得比较突出.(第4章)(4)提出了一种面向领域的数据驱动的电信客户价值评价方法,该方法将领域专家先验知识和数据本身所具有的特征有效地结合起来,提高了电信行业客户关系管理的能力.首先借助领域专家的先验知识分别从客户当前价值和潜在价值两方面进行特征数据的提取、学习数据类别标定,而后以各决策类集的最大确定性作为变精度阈值进行自主式学习而获取决策规则.该方法有效地将领域专家的先验知识和数据本身特征进行了有机结合.由于电信客户数据量大且具有类别标定的学习数据难以获取,在训练数据集选择和类别标定过程中,采用了基于近邻熵的主动学习方法来最大限度地减少领域专家的工作量和提高对训练数据的选择质量.通过在实际运营商客户数据上的仿真实验对比,表明了该方法的有效性.这为电信运营商针对不同类型的客户采取不同的营销和服务策略奠定了坚实的基础,也为其他实际问题的解决提供了有益的借鉴.(第5章)
【关键词】:数据挖掘 粗糙集 优势关系 不确定性 变精度模型 自主式学习 客户价值计价
【学位授予单位】:西南交通大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:TP18
【目录】:
- 摘要7-9
- Abstract9-17
- 第1章 绪论17-40
- 1.1 数据挖掘概述17-21
- 1.1.1 数据挖掘的概念17-18
- 1.1.2 数据挖掘的过程18-19
- 1.1.3 数据挖掘的主要方法19-20
- 1.1.4 数据挖掘的应用与发展20-21
- 1.2 不确定性信息及处理概述21-27
- 1.2.1 不确定性数据的来源22-23
- 1.2.2 不确定性数据的表现形式23
- 1.2.3 不确定性数据的处理理论23-27
- 1.3 粗糙集概述27-32
- 1.3.1 粗糙集的理论背景27-28
- 1.3.2 粗糙集的基本概念28-30
- 1.3.3 粗糙集的研究与发展30-32
- 1.4 优势关系粗糙集概述32-37
- 1.4.1 优势关系粗糙集的理论背景32-33
- 1.4.2 优势关系粗糙集的基本概念33-36
- 1.4.3 基于优势关系粗糙集的不确定性信息处理方法36-37
- 1.5 本文的主要研究内容及成果37-39
- 1.6 本文的组织结构39-40
- 第2章 基于包含度和支持度的变精度DRSA模型40-62
- 2.1 引言40-41
- 2.2 变精度粗糙集与变精度优势关系粗糙集41-43
- 2.2.1 变精度粗糙集41-42
- 2.2.2 变精度优势关系粗糙集42-43
- 2.3 现有变精度优势关系粗糙集模型43-47
- 2.3.1 VC-DRSA模型44-46
- 2.3.2 VP-DRSA模型46-47
- 2.4 基于包含度和支持度的变精度DRSA模型47-55
- 2.4.1 VC-DRSA和VP-DRSA模型分析47-49
- 2.4.2 基于包含度和支持度的变精度模型49-52
- 2.4.3 实例分析52-55
- 2.5 仿真实验55-61
- 2.5.1 基于投票的分类方法56-57
- 2.5.2 实验数据集选择57
- 2.5.3 实验过程57-58
- 2.5.4 实验结果与分析58-61
- 2.6 本章小结61-62
- 第3章 优势关系信息系统的一致化转换62-78
- 3.1 引言62-63
- 3.2 对象整体不一致性度量63-65
- 3.3 不一致优势关系信息系统的一致化转换算法65-68
- 3.3.1 算法描述65-68
- 3.3.2 算法复杂度分析68
- 3.4 实例分析68-71
- 3.5 仿真实验71-76
- 3.5.1 实验数据集选择72
- 3.5.2 实验过程72-73
- 3.5.3 实验结果与分析73-76
- 3.6 本章小结76-78
- 第4章 优势关系下的自主式学习方法78-94
- 4.1 引言78-79
- 4.2 数据驱动的自主式学习79-82
- 4.3 变精度优势关系粗糙集分类性能分析82-84
- 4.4 优势关系决策表与决策类集的一致性度量84-87
- 4.5 优势关系下的自主式学习算法87-89
- 4.6 仿真实验89-93
- 4.6.1 实验数据集选择89
- 4.6.2 实验过程89-90
- 4.6.3 实验结果与分析90-93
- 4.7 本章小结93-94
- 第5章 面向领域的数据驱动的电信客户价值评价方法94-113
- 5.1 引言94-96
- 5.2 客户价值与评价96-102
- 5.2.1 客户价值的概念96-97
- 5.2.2 客户价值理论模型97-100
- 5.2.3 电信客户价值与评价100-102
- 5.3 面向领域的数据驱动的数据挖掘模型102-104
- 5.3.1 领域驱动的数据挖掘102-103
- 5.3.2 面向领域的数据驱动的数据挖掘103-104
- 5.4 面向领域的数据驱动的电信客户价值评价方法104-108
- 5.4.1 电信客户价值评价的特征提取104-105
- 5.4.2 电信客户价值评价流程105-107
- 5.4.3 电信客户价值评价算法107-108
- 5.5 仿真实验108-112
- 5.5.1 算法效果验证108-110
- 5.5.2 算法应用110-112
- 5.6 本章小结112-113
- 第6章 总结与展望113-116
- 6.1 本文工作总结113-115
- 6.2 进一步研究工作与展望115-116
- 致谢116-118
- 参考文献118-133
- 攻读博士学位期间发表的论文及科研成果133-135
- 读博期间论文发表情况133-134
- 读博期间参与的科研项目134-135
- 读博期间所申请的专利13
【相似文献】
中国期刊全文数据库 前10条
1 王俊红,梁吉业;概念格与粗糙集[J];山西大学学报(自然科学版);2003年04期
2 谭思云,张青枝,李志明;基于粗糙集的分类和规则归纳法[J];武汉理工大学学报;2003年02期
3 刘永红;;粗糙集的格刻画[J];模式识别与人工智能;2003年02期
4 孙海军,蒋东翔,钱立军,战祥森;基于粗糙集理论的旋转机械故障诊断方法[J];动力工程;2004年01期
5 陈欢;基于粗糙集理论的值约简及规则提取[J];福州大学学报(自然科学版);2004年04期
6 舒兰,赵磊;粗糙集的模糊性[J];电子科技大学学报;2005年01期
7 刘靖,陈福生,张勤;基于粗糙集和模糊集的属性约简算法[J];计算机工程与科学;2005年02期
8 赵青杉;王建国;刘婧;;基于粗糙集的风湿性二尖瓣狭窄疾病诊断[J];太原科技大学学报;2006年03期
9 刘海泉;张永强;;一种基于粗糙集理论的特征选取方法[J];科技资讯;2007年28期
10 覃伟荣;秦亮羲;朱杰;;基于粗糙集分类器设计与应用研究[J];微计算机信息;2008年33期
中国重要会议论文全文数据库 前10条
1 黎文航;陈善本;王兵;;粗糙集理论在焊接中的应用综述[A];第十一次全国焊接会议论文集(第2册)[C];2005年
2 尹宗成;;粗糙集理论在我国粮食产量预测中的应用[A];现代农业理论与实践——安徽现代农业博士科技论坛论文集[C];2007年
3 邹刚;滕书华;孙即祥;陈森林;敖永红;;一种粗糙集优化协同原型模式约简分类方法[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年
4 葛丽;傅彦;;粗糙集在科学数据属性约简中的应用[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
5 陈雪飞;;粗糙集分类中耦合数据的处理方法研究[A];2008年全国开放式分布与并行计算机学术会议论文集(上册)[C];2008年
6 肖健梅;芦晓明;王锡淮;;集装箱起重机防摇系统粗糙集控制[A];第二十六届中国控制会议论文集[C];2007年
7 王印松;冯康;;主汽温调节系统性能评价的粗糙集实现方法[A];第二十七届中国控制会议论文集[C];2008年
8 王红萍;万程亮;金彦丰;;应用粗糙集理论的对抗效果权重确定方法[A];2009’中国西部地区声学学术交流会论文集[C];2009年
9 王莉;周献中;;一种基于粗糙集的模糊神经网络模型在钢材力学性能预测中的研究[A];2009年中国智能自动化会议论文集(第二分册)[C];2009年
10 卓明;王丽珍;谭旭;;基于粗糙集近似集扩展的规则提取算法[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
中国博士学位论文全文数据库 前10条
1 薛佩军;正负域覆盖广义粗糙集与知识粗传播研究[D];山东大学;2007年
2 孔芝;粗糙集理论若干问题的研究与应用[D];东北大学;2009年
3 秦中广;基于粗糙集的交叉研究及其在中医诊断的应用[D];华南理工大学;2002年
4 刘少辉;知识发现中粗糙集理论的研究[D];中国科学院研究生院(计算技术研究所);2003年
5 邓大勇;基于粗糙集的数据约简及粗糙集扩展模型的研究[D];北京交通大学;2007年
6 孙英娟;基于粗糙集的分类方法研究[D];吉林大学;2011年
7 杨田;覆盖粗糙集约简理论及应用[D];湖南大学;2010年
8 刘业政;基于粗糙集数据分析的智能决策支持系统研究[D];合肥工业大学;2002年
9 王加阳;面向海量数据的粗糙集理论与方法研究[D];中南大学;2005年
10 王庆东;基于粗糙集的数据挖掘方法研究[D];浙江大学;2005年
中国硕士学位论文全文数据库 前10条
1 陈艳;粗糙集理论及其推广模型的研究[D];电子科技大学;2008年
2 王昕娅;基于概念格模型的粗糙集约简方法研究[D];合肥工业大学;2006年
3 曾建武;粗糙集理论及故障诊断应用研究[D];浙江大学;2006年
4 王永茂;粗糙集理论在燃煤发热量预测中的应用研究[D];华北电力大学(北京);2003年
5 刘巧云;粗糙集在氧化铝种分数据分析中的应用[D];中南大学;2007年
6 张达;基于粗糙集理论的公交优先控制算法研究[D];广西大学;2007年
7 朱雅琼;基于粗糙集理论的金矿矿化信息挖掘与分析[D];武汉理工大学;2007年
8 张晓红;基于信息熵的粗糙集理论的研究和应用[D];安徽大学;2011年
9 解毅;基于直觉不确定粗糙集的智能电网故障诊断[D];东北大学;2010年
10 王璐;基于模糊覆盖的粗糙集理论研究[D];西安工程大学;2012年
,本文编号:621337
本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/621337.html