面向动态不完备数据的特征选择模型与算法研究

发布时间:2017-06-21 03:00

  本文关键词:面向动态不完备数据的特征选择模型与算法研究,由笔耕文化传播整理发布。


【摘要】:随着计算机与网络信息技术的快速发展,数据的数量和规模呈现出空前的增长速度,为我们带来了一个数据膨胀、信息爆炸时代。一方面,现有数据从TB级向PB的急剧增长使得数据在规模上已超于人类分析和获取知识的能力。另一方面,数据量的爆炸式增长使传统的知识获取方法显得束手无策,但是不断丰富的数据蕴含信息给人们带来了更多有价值的知识。如何对现实领域中的海量高维数据进行有效的预处理,从而挖掘出潜在有用的知识,已成为当前数据挖掘、计算智能和机器学习的重要研究课题之一。 特征选择是数据挖掘中一个重要数据预处理技术。面临着现实中许多复杂环境下数据往往呈现的动态性、不完备性和不精确性等特征,如何高效可行地对数据进行特征选择,是目前特征选择研究面临的巨大挑战问题之一。作为一种刻画不确定性和不精确信息的数学工具,粗糙集理论已被广泛应用到数据挖掘、知识发现和机器学习等领域中,该理论最大的优势是不依赖给定数据集之外的任何先验信息来处理问题,对问题的描述和处理更加客观。因此,利用粗糙集理论方法研究面向动态不完备数据的特征选择有着重要的理论和现实意义。 本文在动态不完备数据的现实背景下,在如何快速、有效地获取特征子集结果进而获取动态知识这一实际需求的驱动下,在基于粗糙集理论的特征选择框架下,以增量式更新策略为研究方法,以不完备数据集发生动态变化的三种不同情景为主线,系统地研究了动态不完备数据集下特征子集的增量式更新问题,研究目的以增量式方法为动态不完备数据的特征选择探索有效的途径,为动态数据的知识发现探寻新的理论依据和实现方法。为此,本文以粗糙集理论为研究工具,针对动态不完备数据进行系统的特征选择研究,取得的主要研究成果如下。 1)提出不完备数据集中对象集发生增加和删除时正区域的增量式更新机制,在正区域更新机制的基础上,定义特征重要度的度量函数,并设计对象集随时间变化时基于正区域的增量式特征选择算法。相关实验结果验证了提出算法的高效性和可行性。(第二章) 2)针对不完备数据集中特征集发生增加和删除情况,通过分析不完备数据集中容差粒度的变化,分别建立特征集增加和删除下正区域的增量式更新机制,并依此分别设计了特征集增加和删除时的增量式特征选择算法。理论分析和相关实验结果都验证了提出算法的高效性和有效性。(第三章) 3)提出不完备数据集中特征值发生动态变化时正区域的增量式更新机制,在此基础上,并设计了特征值随时间变化时增量式特征选择算法。特别是当多个对象的特征值发生动态变化时,提出算法可一次性求得特征子集结果,无需重复执行单个对象特征值变化时的增量式特征选择算法来求解特征子集。理论分析和相关实验结果都验证了提出算法的高效性和有效性。(第四章) 4)针对不完备数据集中单一特征评估函数在现有特征选择算法中面临的缺点,结合粒度度量准则,从不同角度出发,提出一种基于混合特征评估函数来度量候选特征的区分能力,并设计基于贪心向前搜索的特征选择算法。同时,针对代价敏感的不完备数据集,以混合度量的视角为出发点,提出一种混合评估函数来度量特征子集的质量。在此基础上,为进一步加快特征选择进程,提出一种特征选择中不断减小搜索空间的策略,结合此策略设计了面向代价敏感的高效特征选择算法。相关实验结果验证了提出算法的高效性和有效性。(第五章)
【关键词】:数据挖掘 动态不完备数据 特征选择 粒度计算 粗糙集理论
【学位授予单位】:北京交通大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:TP311.13;TP18
【目录】:
  • 致谢5-6
  • 摘要6-8
  • ABSTRACT8-11
  • 目录11-14
  • 1 绪论14-36
  • 1.1 研究意义14-16
  • 1.2 特征选择16-18
  • 1.3 基于粗糙集的特征选择18-27
  • 1.3.1 粗糙集理论的预备知识20-24
  • 1.3.2 粗糙集特征选择的研究现状24-27
  • 1.4 动态不完备数据的特征选择27-31
  • 1.4.1 面向不完备数据的特征选择27-29
  • 1.4.2 面向动态数据的特征选择29-31
  • 1.5 本文的研究框架31-36
  • 1.5.1 研究思路31-33
  • 1.5.2 研究内容和组织结构33-36
  • 2 对象集动态变化时增量式特征选择36-64
  • 2.1 引言36-38
  • 2.2 问题描述38-39
  • 2.3 基于正区域的特征选择39-44
  • 2.4 单个对象增删时增量式特征选择44-51
  • 2.4.1 单个对象增删时正区域的更新机制44-47
  • 2.4.2 单个对象同时增删时特征选择算法47-51
  • 2.5 多个对象增删时增量式特征选择51-57
  • 2.5.1 多个对象增删时正区域的更新机制52-54
  • 2.5.2 多个对象同时增删时特征选择算法54-57
  • 2.6 实验分析57-62
  • 2.6.1 特征子集57-58
  • 2.6.2 运行时间58-60
  • 2.6.3 分类精度60-62
  • 2.7 本章小结62-64
  • 3 特征集动态变化时增量式特征选择64-86
  • 3.1 引言64-65
  • 3.2 问题描述65-66
  • 3.3 特征集增删时正区域更新机制66-69
  • 3.4 特征集合增删时增量式特征选择算法69-74
  • 3.4.1 算法设计69-73
  • 3.4.2 算法时间复杂度分析73-74
  • 3.5 实验分析74-84
  • 3.5.1 运行时间75-80
  • 3.5.2 敏感性分析80-81
  • 3.5.3 特征集同时增加和删除的比较81-83
  • 3.5.4. 分类精度83-84
  • 3.6 本章小结84-86
  • 4 特征值动态变化时增量式特征选择86-114
  • 4.1 引言86-87
  • 4.2 问题描述87-88
  • 4.3 单个对象特征值变化时增量式特征选择88-95
  • 4.3.1 单个对象特征值变化时正区域的更新机制88-92
  • 4.3.2 单个对象特征值变化时增量式特征选择算法92-95
  • 4.4 多个对象特征值变化时增量式特征选择95-99
  • 4.4.1 多个对象特征值变化时正区域的更新机制95-97
  • 4.4.2 多个对象特征值变化时增量式特征选择算法97-99
  • 4.5 实验分析99-113
  • 4.5.1 算法的高效性100-103
  • 4.5.2 算法的有效性103-113
  • 4.6 本章小结113-114
  • 5 基于混合度量的高效特征选择114-144
  • 5.1 引言114-115
  • 5.2 面向不完备数据的混合度量特征选择算法115-124
  • 5.2.1 问题描述116
  • 5.2.2 特征度量116-118
  • 5.2.3 算法设计118-119
  • 5.2.4 实验分析119-124
  • 5.3 面向代价敏感数据的混合度量特征选择算法124-141
  • 5.3.1 问题描述125
  • 5.3.2 相关工作125-128
  • 5.3.3 特征度量128-131
  • 5.3.4 算法设计131-135
  • 5.3.5 实验分析135-141
  • 5.4 本章小结141-144
  • 6 结论与展望144-148
  • 6.1 研究工作总结144-145
  • 6.2 进一步研究展望145-148
  • 参考文献148-158
  • 附录A158-160
  • 作者简历及攻读博士学位期间取得的研究成果160-164
  • 学位论文数据集164

【参考文献】

中国期刊全文数据库 前10条

1 钱进;苗夺谦;张泽华;;云计算环境下知识约简算法[J];计算机学报;2011年12期

2 苗夺谦;陈玉明;王睿智;张红云;;图表示下的知识约简[J];电子学报;2010年08期

3 官礼和;王国胤;;决策表属性约简集的增量式更新算法[J];计算机科学与探索;2010年05期

4 刘勇;熊蓉;褚健;;Hash快速属性约简算法[J];计算机学报;2009年08期

5 杨明;杨萍;;基于广义差别矩阵的核和属性约简算法[J];控制与决策;2008年09期

6 叶玉玲;伞冶;;基于遗传算法的粗糙集混合数据属性约简[J];哈尔滨工业大学学报;2008年05期

7 胡清华;于达仁;谢宗霞;;基于邻域粒化和粗糙逼近的数值属性约简[J];软件学报;2008年03期

8 叶东毅;廖建坤;;基于二进制粒子群优化的一个最小属性约简算法[J];模式识别与人工智能;2007年03期

9 杨明;;一种基于改进差别矩阵的属性约简增量式更新算法[J];计算机学报;2007年05期

10 杨成福;舒兰;;基于容差关系的不完备决策系统属性约简算法[J];计算机技术与发展;2006年09期


  本文关键词:面向动态不完备数据的特征选择模型与算法研究,由笔耕文化传播整理发布。



本文编号:467446

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/467446.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户cb9ef***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com