基于遗传算法和改进兴趣度的关联规则挖掘算法
本文关键词:基于遗传算法和改进兴趣度的关联规则挖掘算法
【摘要】:互联网社会改变了人们的行为方式和思考方式,在这个信息社会里人类积累海量的数据,如何从这些海量数据中挖掘出“黄金”知识变得越来越重要。因此,数据挖掘这门学科越来越成为社会关注的焦点。关联规则是数据挖掘的重要研究内容,研究关联规则挖掘是为了从大量的数据中找出项与项之间的相关关系。本文首先介绍了关联规则的基本概念和有关性质,然后对关联规则的经典算法—apriori算法进行了详细的介绍,接着对数据挖掘的重要方法之一的遗传算法进行简要的介绍,包括遗传算法的基本术语和运行过程。在传统支持度—置信度框架下挖掘关联规则可能会挖掘出一些无用的甚至有误导性的规则,而一些有用的关联规则却不一定能被挖掘出来,于是引入了兴趣度来改进传统框架。兴趣度表征一个规则的有趣程度,通过它可将一些无用的有误导性的规则给淘汰掉。本文首先提出了一种改进的兴趣度模型,然后从理论上和实验两个方面证明该兴趣度模型要好于常见的兴趣度模型。本文分析了遗传算法在关联规则挖掘中的天然优势,对遗传算法挖掘关联规则研究现状和不足进行了总结,并且阐述了将遗传算法和兴趣度结合挖掘关联规则的思想。最后将遗传算法和本文提出的改进兴趣度模型进行结合,得到了一种新的关联规则挖掘算法,即基于遗传算法和改进兴趣度的关联规则挖掘算法。通过和已经存在的两个关联规则挖掘算法进行实验对比表明了本文提出的算法能更多地淘汰无趣规则,因而本文提出的算法是高效的,具有一定的应用价值,可将其应用到科研和实践中。
【关键词】:数据挖掘 关联规则 遗传算法 兴趣度
【学位授予单位】:广西师范学院
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP311.13;TP18
【目录】:
- 摘要4-5
- Abstract5-8
- 第一章 概述8-14
- 1.1 数据挖掘8-11
- 1.1.1 数据挖掘概念8
- 1.1.2 数据挖掘的过程8-10
- 1.1.3 数据挖掘的应用10-11
- 1.2 数据挖掘与关联规则11-12
- 1.3 数据挖掘与遗传算法12-13
- 1.4 本文研究目标及内容13
- 1.5 论文结构13-14
- 第二章 关联规则和遗传算法相关介绍14-29
- 2.1 关联规则的基本概念14
- 2.2 关联规则的挖掘定理和性质14-16
- 2.3 apriori算法16-22
- 2.4 遗传算法引言22
- 2.5 遗传算法的基本术语22-23
- 2.6 遗传算法的运行过程及相应说明23-29
- 2.6.1 编码24-25
- 2.6.2 适应度评价25
- 2.6.3 选择操作[19]25-27
- 2.6.4 交叉操作27-29
- 2.6.5 变异操作29
- 2.7 本章总结29
- 第三章 一种改进的兴趣度模型29-45
- 3.1 提升度的引入29-32
- 3.2 兴趣度引言32
- 3.3 现有的兴趣度模型32-34
- 3.3.1 概率兴趣度模型33
- 3.3.2 差值的兴趣度模型33-34
- 3.3.3 信息量兴趣度34
- 3.4 新的兴趣度模型34-36
- 3.5 本兴趣度模型和其他其他兴趣度模型的比较分析36-39
- 3.6 本章实验算法描述39-41
- 3.7 实验结果分析与比较41-45
- 3.8 本章小结45
- 第四章 一种基于遗传算法和改进兴趣度的关联规则挖掘算法45-67
- 4.1 遗传算法应用于关联规则挖掘的现状和不足46
- 4.2 遗传算法和兴趣度结合挖掘关联规则的思想46-47
- 4.3 本文算法的实现过程47-50
- 4.3.1 编码47-48
- 4.3.2 适应度函数48
- 4.3.3 遗传算法操作过程48-49
- 4.3.4 本文算法设计49-50
- 4.4 两个比较算法的简单描述50-53
- 4.4.1 基于遗传算法和提升度的关联规则挖掘算法50-52
- 4.4.2 基于遗传算法和差异兴趣度的关联规则挖掘算法52-53
- 4.5 实验设计与分析53-57
- 4.5.1 遗传算法的编码53-56
- 4.5.2 参数设置56-57
- 4.6 实验结果分析57-64
- 4.6.1 基于遗传算法和提升度的关联规则挖掘算法的实验结果57-60
- 4.6.2 基于遗传算法和差值兴趣度的关联规则挖掘算法的实验结果60-62
- 4.6.3 基于遗传算法和改进兴趣度的关联规则挖掘算法的实验结果62-64
- 4.7 实验结果分析和比较64-66
- 4.8 本章总结66-67
- 第五章 总结与展望67-69
- 参考文献69-71
- 附录A 本文作者在攻读硕士学位期间所发表的论文71-72
- 致谢72-73
【相似文献】
中国期刊全文数据库 前10条
1 杨炳儒;綦艳霞;;感兴趣度的研究综述[J];计算机科学;2001年10期
2 曹文平;;基于用户知识的主观兴趣度度量方法研究[J];华南金融电脑;2007年07期
3 苏云辉;张莹;白清源;谢丽聪;谢伙生;;基于访问兴趣度的用户事务聚类方法[J];广西师范大学学报(自然科学版);2007年04期
4 斯康;;关联规则兴趣度研究[J];电脑知识与技术;2008年24期
5 董辉;;基于兴趣度的高职课程关联规则挖掘[J];吉首大学学报(自然科学版);2012年03期
6 李佐军;;关联规则挖掘兴趣度模型研究[J];电脑知识与技术;2014年06期
7 马建庆;钟亦平;张世永;;基于兴趣度的关联规则挖掘算法[J];计算机工程;2006年17期
8 汪慎文;刘坤起;石艳丽;;基于兴趣度的多值关联规则挖掘[J];微计算机信息;2008年24期
9 邓春林;邹凯;;基于关联规则的图书馆读者兴趣度实证分析[J];情报理论与实践;2009年04期
10 陆楠;梁正平;杜文峰;;一种面向商业智能兴趣度的顾客目录分割算法[J];信息与电脑(理论版);2011年03期
中国重要会议论文全文数据库 前3条
1 周皓峰;高攀;施伯乐;;一个基于兴趣度包含负属性项的关联规则采掘算法[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
2 曲爽;谷文祥;;基于兴趣度和负项集的关联规则挖掘算法的研究[A];2005年全国理论计算机科学学术年会论文集[C];2005年
3 方炜炜;杨炳儒;唐志刚;杨君;;基于客观兴趣度的关联规则优化算法研究[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
中国重要报纸全文数据库 前6条
1 ;音乐,我不能没有你[N];中国消费者报;2000年
2 李宝春;长虹开创Portable视听新时代[N];中华工商时报;2003年
3 李宝春;长虹移动DVD完美上市[N];经济参考报;2003年
4 周童;Vista赚尽眼球[N];计算机世界;2007年
5 孙海东;国际科教大片为何无人喝彩[N];市场报;2000年
6 本报记者 兰海燕;谁该先补“这一课”?[N];工人日报;2001年
中国硕士学位论文全文数据库 前10条
1 李媛;基于位置的社交网络推荐算法的研究与应用[D];中国科学院研究生院(沈阳计算技术研究所);2015年
2 杨强;基于Web-log频繁浏览路径挖掘技术分析与实现[D];电子科技大学;2014年
3 姜盛彬;数据挖掘中基于兴趣度的关联规则研究[D];湖南师范大学;2015年
4 姚贝;基于Hadoop的用户浏览路径挖掘技术研究[D];湖南工业大学;2015年
5 高秋云;基于用户兴趣度和地理位置的活动推荐[D];南京邮电大学;2016年
6 包勇;基于遗传算法和改进兴趣度的关联规则挖掘算法[D];广西师范学院;2016年
7 沈建华;基于用户兴趣度的社区内容推荐方法研究[D];东北大学;2013年
8 吴杰;基于兴趣度的关联规则挖掘[D];哈尔滨理工大学;2009年
9 刘正红;基于兴趣度的关联规则挖掘算法研究[D];东北师范大学;2009年
10 靳峰;基于兴趣度的推荐系统研究[D];西安建筑科技大学;2005年
,本文编号:1050036
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/1050036.html