频繁项集快速挖掘算法研究及应用

发布时间:2018-04-22 12:51

  本文选题:频繁项集挖掘 + Eclat算法 ; 参考:《太原理工大学》2017年硕士论文


【摘要】:随着信息技术的发展,数据呈指数型增长,传统数据挖掘算法对大规模数据的处理和应用存在挖掘效率低,难以实现有效应用等不足。数据的产生、收集、存储和分析等都需要大数据技术的支持,因此如何将传统数据挖掘算法与大数据技术有效结合成为当前的研究热点。现有频繁项集挖掘算法在处理大数据时,存在运行时间过长、内存溢出等缺点,故将其与大数据技术有效结合,有助于进一步实现大数据产业化应用。一方面,大数据技术使数据分析、处理速度加快,提高了算法运行效率;另一方面,通过分析数据的隐含价值,进行应用研究,为生产生活提供便利。本文基于频繁项集挖掘算法和大数据技术,探索效率更高的算法,并将本文算法应用于现实中。具体而言,本文主要完成了以下三方面的研究:(1)Eclat算法改进研究深入分析Eclat算法,结合频繁项集自身性质,从候选集优化和剪枝两方面优化算法。通过筛选候选集,剔除非候选集,减少交集运算的次数,提出了改进算法——Eclat’算法。在公开数据集上进行实验,分析算法性能,并验证了算法的有效性。(2)改进算法的并行化实现为了更高效地使用和分析数据,本文基于MapReduce并行实现Eclat’算法,并在Hadoop集群上完成了相关实验,实验结果表明:并行实现的算法对大数据处理有较好的性能。(3)应用研究对手机用户数据进行应用研究,分析数据中各属性间的关系,结果可向用户更合理地推荐APP(application,手机软件),最后对本课题在智慧城市中的应用作了进一步探索。
[Abstract]:With the development of information technology and exponential growth of data , the traditional data mining algorithm has the disadvantages of low mining efficiency , difficult realization of effective application , etc .

【学位授予单位】:太原理工大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP311.13

【参考文献】

相关期刊论文 前9条

1 阿尔伯特·梅耶;曼努尔·彼得罗·罗德里格斯·玻利瓦尔;奉莹;王欣红;陈叶盛;;管理智慧城市:关于智慧城市治理的文献综述[J];国际行政科学评论(中文版);2016年04期

2 奚加荣;;如何做好智慧城市的架构设计?[J];通信世界;2015年17期

3 朱亚杰;李琦;冯逍;;基于大数据的智慧城市技术体系架构研究[J];测绘科学;2014年08期

4 刘彩苹;毛建频;毛建旭;屈卫兰;蔡玉武;;基于格的快速频繁项集挖掘算法[J];湖南大学学报(自然科学版);2013年10期

5 徐嘉莉;杨洪军;赵茂娟;樊云;;一种基于位运算的频繁闭项集挖掘算法[J];计算机应用研究;2013年11期

6 冯培恩;刘屿;邱清盈;李立新;;提高Eclat算法效率的策略[J];浙江大学学报(工学版);2013年02期

7 宋刚;邬伦;;创新2.0视野下的智慧城市[J];北京邮电大学学报(社会科学版);2012年04期

8 张李一;张守志;施伯乐;;一种不确定性数据频繁模式的垂直挖掘算法[J];小型微型计算机系统;2012年02期

9 郭景峰;张伟;柴然;;一种新的频繁子图挖掘算法[J];计算机工程;2011年20期

相关博士学位论文 前1条

1 夏大文;基于MapReduce的移动轨迹大数据挖掘方法与应用研究[D];西南大学;2016年

相关硕士学位论文 前4条

1 刘文玲;物联网环境下关联规则算法在公交事故分析中的应用研究[D];合肥工业大学;2016年

2 杨君薇;基于SPF的流数据离群点挖掘研究[D];太原理工大学;2015年

3 黄雯;数据挖掘算法及其应用研究[D];南京邮电大学;2013年

4 杨仁华;关联规则学习与反馈技术及其在网络安全审计系统中的应用研究[D];山东师范大学;2010年



本文编号:1787293

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/1787293.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户a00da***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com