GEP技术在高校学生成绩分析中的应用研究
发布时间:2017-05-12 01:05
本文关键词:GEP技术在高校学生成绩分析中的应用研究,由笔耕文化传播整理发布。
【摘要】:从大量同构或异构的数据中,采用不同的算法挖掘出有用信息的过程,为决策分析提供指导,是数据挖掘技术的主要内容。在很多领域都有大量的学者在研究数据挖掘技术,同时也取得了不少非常优秀的研究成果。关联规则,作为数据挖掘技术的一个非常重要的分支,是从海量数据中提取出其中数据属性之间的有趣的各种关系,并利用这些关系为各种决策分析做指导,近年来在很多领域中都得到了广泛的研究,并且取得了不菲的成绩。 进化算法是数据挖掘技术的一个分支,是从达尔文的进化论和孟德尔的遗传学中获得灵感,将不同物种之间的竞争、适者生存、遗传的规律引入到解决工程技术问题,通过生成初始解、再对初始解进行繁殖、竞争、遗传的过程,直到逼近问题的最优解。基因表达式编程(Gene Expression Programming, GEP),作为进化算法的新成员,结合了原始进化成员遗传算法(Genetic Algorithm, GA)和遗传编程(Genetic Programming,GP)的优势,在解决很多领域的问题都有突出的贡献。 本文先是对数据挖掘技术相关概念、算法、应用、分类等进行了介绍,其中主要介绍了关联规则算法的相关原理、算法流程、算法分类等。接着对传统基因表达式编程进行了概述,分别对构成GEP编程的五大部分进行了介绍:编码、适应度函数、遗传操作、数值常量,并进行了两处改进:针对传统GEP算法产生初始种群是随机的,容易导致初代种群分布不均匀,因而可能会导致在遗传过程中个体多样性受限,使得算法失败或者收敛到局部最优解的问题,进行了种群初始化的均匀化算法改进;针对在传统GEP进行个体评测时,需要不断进行基因表达式树的创建、遍历、释放,在解决复杂问题时,消耗大量时间空间的问题,进行了无表达式树的个体适应度函数值计算方法的改进。改进前后,对算法进行了实验分析对比。 最后用改进的基因表达式编程(GEP)对高校学生成绩信息进行关联规则数据挖掘,对学生成绩信息进行分析,挖掘出学生成绩信息中课程与课程之间的关系,以及课程与综合成绩之间的关系,为提高学生成绩、提升教学质量做指导,为课程安排计划提供支持。
【关键词】:基因表达式编程 关联规则 学生成绩信息 数据挖掘
【学位授予单位】:西南交通大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:G642.4;TP311.13
【目录】:
- 摘要6-7
- Abstract7-11
- 第1章 绪论11-17
- 1.1 研究背景及意义11-13
- 1.2 国内外现状研究13-14
- 1.3 本文研究的主要内容、目标和方法14-16
- 1.3.1 课题研究目标14-15
- 1.3.2 研究内容15
- 1.3.3 拟解决的关键问题15
- 1.3.4 研究方法以及技术路线15-16
- 1.4 论文结构16-17
- 第2章 数据挖掘相关技术17-26
- 2.1 数据挖掘17-20
- 2.1.1 数据挖掘的概念和过程17-19
- 2.1.2 数据挖掘的应用和分类19-20
- 2.2 关联规则算法20-25
- 2.2.1 关联规则的概念和步骤20-22
- 2.2.2 关联规则的分类和相关算法22-25
- 2.3 本章小结25-26
- 第3章 基因表达式编程26-35
- 3.1 传统GEP的基本思想26-33
- 3.1.1 编码26-28
- 3.1.2 适应度函数28-29
- 3.1.3 遗传操作29-32
- 3.1.4 数值常量与停机条件32-33
- 3.2 传统GEP的算法流程33-34
- 3.3 GEP算法的特征34
- 3.4 本章小结34-35
- 第4章 基因表达式编程的改进35-48
- 4.1 GEP初始种群均匀化的改进35-38
- 4.2 GEP个体适应度评测算法的改进38-41
- 4.3 仿真实验与分析41-46
- 4.4 本章小结46-48
- 第5章 GEP技术在学生成绩中的应用48-65
- 5.1 学生学期综合成绩处理48-49
- 5.2 基于GEP关联规则的学生成绩分析49-58
- 5.2.1 学生成绩收集49-50
- 5.2.2 学生成绩预处理50-52
- 5.2.3 GEP挖掘学生成绩关联关系52-58
- 5.3 基于GEP聚类的学生成绩综合评价58-64
- 5.3.1 学生成绩收集、预处理59
- 5.3.2 GEP聚类学生综合成绩评价59-64
- 5.4 本章小结64-65
- 结论与未来的工作65-66
- 致谢66-67
- 参考文献67-71
- 攻读硕士学位期间发表的论文71
【参考文献】
中国期刊全文数据库 前10条
1 杨玉;;KDD在零售业客户关系管理中的应用分析研究[J];商业研究;2008年12期
2 魏小锐;;基于关联分析的偏离主题探测[J];东莞理工学院学报;2010年05期
3 秦小铁;吴晓英;陈祖琴;;遗传算法在数字化图书馆数字资源构建中的应用[J];重庆科技学院学报(自然科学版);2013年02期
4 杜海涛;陈定方;张波;;一种基于关联规则的超市购物篮分析方法[J];湖北工业大学学报;2008年02期
5 颜跃进;李舟军;陈火旺;;频繁项集挖掘算法[J];计算机科学;2004年03期
6 黄隆胜;肖士斌;;基因表达式编程在SARS疫情分析及预测中的应用[J];计算机工程;2007年04期
7 段磊;唐常杰;杨宁;左R,
本文编号:358430
本文链接:https://www.wllwen.com/jiaoyulunwen/suzhijiaoyulunwen/358430.html