Apriori算法及其在学生成绩分析中的应用研究
本文关键词:Apriori算法及其在学生成绩分析中的应用研究
【摘要】:数据挖掘技术是信息化技术发展到一定程度的必然结果,它是一类全新的相关数据分析技术,它是在数据海洋中找出有用知识为人类服务的一种技术。关联规则挖掘方法是数据挖掘方法中很重要的方法之一。而最经典的关联规则算法便是Apriori算法,该算法在许多领域(像金融领域、商业领域,等等)都已有了相应的应用,并取得了不错的效果。高校的核心任务是教学,提高教学质量是根本,然而学生的成绩则是衡量教学质量水平的一项重要指标。因此,对学生成绩数据进行相关的数据挖掘处理有着重要的现实意义。利用数据挖掘技术挖掘学生成绩数据,可以挖掘出像课程与课程之间的相互关系、影响学生成绩的各方面因素等有用的知识,这些知识可为教学及相关管理工作提供有力地决策支持,同时也为更好的开展教学工作和提高教学质量提供科学依据。本文主要对基于关联规则技术的挖掘方法作了深入的探究,重点分析了经典的关联规则算法——Apriori算法,指出该算法存在的优缺点,并针对其缺点提出了一种基于事务标记符的优化Apriori算法。在分析基于事务标记符的优化Apriori算法的执行效率之后,针对该优化算法中仍存在的不足,又提出了一种更进一步的优化Apriori算法 Apriori_33算法。Apriori_33算法主要提出了三大优化改进:一是关于数据存储的优化;二是项集在连接之前的优化,三是项集在连接之时的优化。最后,将Apriori_33算法应用于学生成绩数据挖掘当中去。本文使用MS SQL SERVER 2008作为后台数据库,Visual Studio 2010作为开发工具,对学生成绩数据库中存储的成绩数据进行了关联规则挖掘,收获了一定成效。由测试结果可知,课程与课程之间存在一定的关联关系,一门或某几门课程学习的好坏有可能会直接影响到其它后继课程的学习,当然开课的顺序也有可能会对学生的成绩造成影响,这些知识可为教学及相关管理工作提供有力地决策支持,同时也为更好的开展教学工作和提高教学质量提供科学依据。
【关键词】:数据挖掘 关联规则 Apriori算法
【学位授予单位】:湖南大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:G420;TP311.13
【目录】:
- 摘要5-6
- Abstract6-12
- 第1章 绪论12-18
- 1.1 选题背景和研究意义12-13
- 1.2 国内外研究现状13-16
- 1.2.1 数据挖掘的研究现状13-14
- 1.2.2 数据挖掘在教学方面的应用研究现状14-15
- 1.2.3 有关学生成绩间的关联的研究现状15-16
- 1.3 论文的研究内容16
- 1.4 论文的组织结构16-18
- 第2章 数据挖掘技术18-30
- 2.1 数据仓库的概述18-23
- 2.1.1 数据仓库的概念18-20
- 2.1.2 数据仓库的体系结构20-21
- 2.1.3 数据仓库功能结构21-22
- 2.1.4 OLAP技术22-23
- 2.2 数据挖掘23-29
- 2.2.1 数据挖掘的定义23-24
- 2.2.2 数据挖掘过程24-25
- 2.2.3 数据挖掘功能25-26
- 2.2.4 数据挖掘的主要方法26-28
- 2.2.5 DW、OLAP、DM之间的关系28-29
- 2.3 本章小结29-30
- 第3章 关联规则算法及其优化30-54
- 3.1 关联规则的概述30-33
- 3.1.1 关联规则的定义30-31
- 3.1.2 关联规则的分类31-32
- 3.1.3 几种关联规则算法的介绍与比较32-33
- 3.2 关联规则挖掘的Apriori算法33-38
- 3.2.1 使用候选项集找频繁项集33-35
- 3.2.2 由频繁项集产生关联规则35-36
- 3.2.3 Apriori算法举例36-38
- 3.3 Apriori算法的性能分析38-39
- 3.3.1 Apriori算法的缺陷38-39
- 3.3.2 现有的几种改进Apriori算法39
- 3.4 优化Apriori算法39-51
- 3.4.1 一种Apriori算法的改进技术39-43
- 3.4.1.1 改进Apriori算法的描述40
- 3.4.1.2 Apriori_22算法的实现40-42
- 3.4.1.3 Apriori_22算法的举例42-43
- 3.4.2 Apriori算法的进一步改进新思路43-51
- 3.4.2.1 事务数据库的存储优化44-45
- 3.4.2.2 连接之前的相关优化45-46
- 3.4.2.3 连接时的相关优化46-47
- 3.4.2.4 Apriori_33算法的举例47-49
- 3.4.2.5 Apriori_33算法的实现49-51
- 3.5 算法性能分析51-52
- 3.6 本章小结52-54
- 第4章 学生成绩数据挖掘的设计与实现54-68
- 4.1 C++数据访问技术54-55
- 4.2 目标分析55
- 4.3 数据准备55
- 4.4 据预处理55-59
- 4.5 Apriori_33算法在学生成绩中的挖掘实现59-64
- 4.6 挖掘结果及分析64-67
- 4.6.1 与成绩相关关联规则的用途64
- 4.6.2 挖掘实验结果64-66
- 4.6.3 挖掘结果分析66-67
- 4.7 本章小结67-68
- 结论68-70
- 参考文献70-73
- 附录A 攻读学位期间所发表的学术论文目录73-74
- 致谢74
【相似文献】
中国期刊全文数据库 前10条
1 李平荣;;Apriori算法的研究与改进[J];喀什师范学院学报;2014年03期
2 姜红艳;;Apriori关联算法在学生成绩中的应用[J];鞍山师范学院学报;2007年02期
3 张仁寿;罗林开;叶凌君;;Apriori算法对高技能人才市场工资价位影响因素的实证分析[J];中国软科学;2010年01期
4 刘文昌;Apriori算法在客户关系管理中的应用[J];长春大学学报;2005年04期
5 陈建辉;;一种改进的Apriori算法[J];宜春学院学报;2007年04期
6 张自敏;;基于Apriori的加权关联规则挖掘[J];贺州学院学报;2009年01期
7 赵轶;周艳山;;Apriori算法在高校课程设置中的应用研究[J];林区教学;2008年06期
8 傅亚莉;;基于Apriori算法的高职院校课程相关性分析[J];长春工程学院学报(自然科学版);2013年04期
9 梁燕红;;改进的Apriori算法在网络教学中的应用[J];玉林师范学院学报;2012年02期
10 刘宏强;;Apriori关联规则挖掘算法分析与改进[J];中国石油大学胜利学院学报;2009年01期
中国重要会议论文全文数据库 前7条
1 刘擎;刘云涛;罗翌;;关联规则挖掘Apriori算法在当代名老中医流感医案挖掘中的应用及改进探讨[A];2012中国中西医结合学会急救医学专业委员会学术年会论文集[C];2012年
2 陈波;董鹏;邵勇;;基于Apriori算法及其改进算法综述[A];中国通信学会第五届学术年会论文集[C];2008年
3 张彦;刘伟;;结合超市数据的关联规则Apriori算法浅析[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
4 杨宗波;宗容;常俊;彭广军;;入侵检测中Apriori算法的研究与改进[A];2009年研究生学术交流会通信与信息技术论文集[C];2009年
5 梁昌勇;赵艳霞;;基于RFM分析的银行信用卡客户的行为评分模型——应用自组织映射神经网络SOM和Apriori方法[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
6 高明;盛立;刘希玉;;关联规则挖掘中Apriori算法的一种改进[A];山东省计算机学会2005年信息技术与信息化研讨会论文集(二)[C];2005年
7 万敏;潘笑;宾谊沅;;利用Apriori算法实现WEB的个性化服务[A];2005通信理论与技术新进展——第十届全国青年通信学术会议论文集[C];2005年
中国硕士学位论文全文数据库 前10条
1 赵宏利;改进的Apriori算法在大学生心理分析中的研究[D];华中师范大学;2015年
2 王丹;基于云计算的关联规则Apriori算法的研究与实现[D];南昌大学;2015年
3 杨财英;Apriori算法及其在学生成绩分析中的应用研究[D];湖南大学;2016年
4 王达明;基于云计算与医疗大数据的Apriori算法的优化研究[D];北京邮电大学;2015年
5 杨国英;泛在网下基于Apriori算法的移动群组的位置预测[D];南京邮电大学;2013年
6 丁磊;一种改进的Apriori算法在手机评教系统中的研究[D];华中师范大学;2014年
7 朱惠;关联规则中Apriori算法的研究与改进[D];安徽理工大学;2014年
8 王培吉;基于Apriori算法的关联规则挖掘及改进[D];内蒙古大学;2003年
9 朱翼;基于数组的Apriori算法的改进研究[D];哈尔滨师范大学;2014年
10 高晓佳;基于Apriori算法的教育决策系统的研究[D];长春理工大学;2010年
,本文编号:1030853
本文链接:https://www.wllwen.com/jiaoyulilunlunwen/1030853.html