邻域粒化粗糙计算的关键技术研究与应用
发布时间:2017-10-30 01:18
本文关键词:邻域粒化粗糙计算的关键技术研究与应用
【摘要】:粗糙集作为不确定性分析的重要数学工具,在人工智能、数据挖掘、模式识别等领域被广泛应用。经典的Pawlak粗糙集模型存在只能够处理字符属型数据的局限性。近些年来,国内外众多学者提出了许多Pawlak粗糙集的扩展模型,其中邻域粗糙集是经典粗糙集模型的重要推广研究之一。它将Pawlak粗糙集的等价粒化方式推广成将相似的元素归为一族的邻域粒化方式,由此可以更好地处理字符属性和数值属性共存的数据样本。随着信息技术地不断进步,数据智能处理研究方向的新问题也随之出现。这为邻域粗糙集的研究与应用带来了新的挑战。例如,在双论域场景如何构建邻域粗糙集模型;邻域粒化方式与其他粒化模型的差异性应该如何表达;如何更好地利用邻域粗糙集解决实际环境中的新问题中等等。针对这些问题,我们对邻域粗糙集模型做了深入地分析与研究,主要工作包括以下几个方面:(1)面向双论域结构,提出了双论域上的邻域粗糙集模型。同时针对其下近似计算过于严格,而上近似逼近程度无法量化描述的问题,提出了变精度的双论域邻域粗糙集模型。针对双论域转单论域后不完备的信息系统,定义了容差邻域熵并讨论了基于容差邻域熵的属性对决策重要度评估方法。(2)针对不同核粒化结构存在差异性的问题,建立了多核粒化粗糙集模型,详细讨论了模型近似算子的相关性质,并提出基于多核粒化近似质量的属性对决策重要度评估方法。进一步分析了粗糙集计算可分为粒化和粗糙逼近两个步骤,总结了已有研究中多粒度表达都是在粗糙逼近这一阶段的现状,提出了基于粒化的多粒度表达思想,定义了开放多粒度熵和保守多粒度熵。最后提出了基于多粒度熵的属性对决策重要度评估方法,并通过实验验证了方法的有效性。(3)传统的属性选择方法只关注属性个体对决策重要程度却忽略了属性个体在属性子集中的贡献度。针对这一问题,首先用邻域熵重新定义属性的独立性、相关性和冗余性。进一步结合合作博弈理论,提出基于邻域熵的属性贡献度评估方法,对能够帮助其他条件属性提高分类能力的属性个体给出较高的贡献度值。在属性的选择问题中,考虑了属性贡献度和属性对决策重要度两方面因素。最后通过实验分析,验证了模型的有效性。(4)传统的偏好挖掘方法很难处理新用户与新物品同时存在的冷启动问题。针对这一现状,提出了基于双论域邻域粗糙集的偏好挖掘模型。用邻域粒子来描述具有相似关系的用户或者物品,并用双论域邻域粗糙集的下近似算子定义了偏好规则。面向常见的5分评分系统,提出了基于评分基线评估的双论域映射构建方法,通过“正映射”来挖掘代表“喜欢”的正偏好规则。最后通过实验验证了区分正、负映的合理性,并讨论了模型参数的选择问题。实验表明了本文模型相比于Pawlak双论域粗糙集模型更适用于偏好挖掘问题。总体来说,本文从邻域粒化和邻域粗糙逼近两方面来研究邻域粗糙集模型。在邻域粒化方面,提出了容差邻域熵和多粒度熵相概念,并用熵来刻画了属性的对决策的重要度和在属性子集中的贡献度,最后将这种基于熵的属性评估方法应用于属性选择问题。在邻域粗糙逼近问题研究中,我们我们讨论了使用多核粒化下近似算子来定义属性对决策重要度的问题,并将双论域邻域粗糙集模型应用于偏好挖掘问题。
【关键词】:邻域粗糙集 多粒度熵 属性选择 偏好挖掘
【学位授予单位】:电子科技大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:TP18
【目录】:
- 摘要5-7
- ABSTRACT7-12
- 第一章 绪论12-27
- 1.1 研究背景与意义12-15
- 1.1.1 研究背景12-14
- 1.1.2 研究意义14-15
- 1.2 研究现状15-23
- 1.2.1 粗糙集的研究现状15-18
- 1.2.2 邻域粗糙集的研究现状18-19
- 1.2.3 基于粗糙集模型的属性选择研究现状19-20
- 1.2.4 偏好挖掘的研究与应用现状20-23
- 1.3 本文的研究思路与创新23-25
- 1.4 本论文的结构安排25-27
- 第二章 基础理论27-37
- 2.1 Pawlak粗糙集理论27-29
- 2.2 邻域粗糙集理论29-32
- 2.3 Pawlak粗糙集和邻域粗糙集的关系讨论32-33
- 2.4 基于粗糙集模型的属性评估方法33-34
- 2.5 偏好挖掘主要方法34-36
- 2.6 本章小结36-37
- 第三章 双论域邻域粗糙集模型37-51
- 3.1 引言37
- 3.2 邻域粗糙集在双论域上的推广37-42
- 3.2.1 双论域邻域粗糙集37-40
- 3.2.2 变精度双论域邻域粗糙集40-42
- 3.3 关于双论域转单论域问题的一些讨论42-50
- 3.3.1 不完备信息系统上的邻域粗糙集43-46
- 3.3.2 容差邻域熵46-49
- 3.3.3 属性对决策的重要度评估49-50
- 3.4 本章小结50-51
- 第四章 多核粒化粗糙集和多粒度熵51-76
- 4.1 引言51-52
- 4.2 多核粒化粗糙集模型52-62
- 4.2.1 基本概念52-56
- 4.2.1.1 模糊集和模糊算子52-53
- 4.2.1.2 模糊粗糙集的单核粒化53-54
- 4.2.1.3 多粒度粗糙集模型54-56
- 4.2.2 模糊粗糙集的多核粒化56-62
- 4.2.2.1 多核近似算子56-57
- 4.2.2.2 相关性质57-60
- 4.2.2.3 近似质量和属性重要度60-62
- 4.3 粒化的多粒度表达62-64
- 4.4 多粒度熵64-74
- 4.4.1 基本定义64-65
- 4.4.2 相关性质65-67
- 4.4.3 基于多粒度熵的属性评估67-68
- 4.4.4 实验68-74
- 4.5 本章小结74-76
- 第五章 基于邻域熵的合作博弈属性选择模型76-91
- 5.1 引言76
- 5.2 属性的依赖、独立与冗余76-78
- 5.3 属性评估的合作博弈78-81
- 5.4 实验81-90
- 5.4.1 实验一:NECGT-SIGFD vs. SIGFD82-86
- 5.4.2 实验二:NECGT vs. Co FS86-90
- 5.4.3 关于实验的开放性问题讨论90
- 5.5 本章小结90-91
- 第六章 基于双论域邻域粗糙集模型的偏好挖掘91-108
- 6.1 引言91-92
- 6.2 基础理论回顾92-93
- 6.3 数据模型与基线评估93-96
- 6.4 基于双论域邻域粗糙集模型的偏好规则与推荐96-99
- 6.5 实验99-107
- 6.5.1 实验一:偏好规则的含义与推荐99-101
- 6.5.2 实验二:参数讨论101-106
- 6.5.3 实验三:NRSTU vs RSTU106-107
- 6.6 本章小结107-108
- 第七章 总结与展望108-110
- 7.1 全文总结108
- 7.2 后续工作展望108-110
- 致谢110-111
- 参考文献111-120
- 攻读博士期间论文发表情况120-121
【参考文献】
中国期刊全文数据库 前1条
1 李德毅,刘常昱,杜瀊,韩旭;不确定性人工智能[J];软件学报;2004年11期
,本文编号:1115483
本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/1115483.html