当前位置:主页 > 管理论文 > 统计学论文 >

基于决策树算法的考试成绩分析系统的研究与开发

发布时间:2016-10-01 12:22

  本文关键词:基于决策树算法的考试成绩分析系统的研究与开发,由笔耕文化传播整理发布。


《湖南大学》 2008年

基于决策树算法的考试成绩分析系统的研究与开发

黄爱辉  

【摘要】: 在高职院校的教学管理中,特别是学生成绩管理工作中,每年产生大量的学生成绩数据,但对这些数据的处理还停留在简单的数据备份、查询及简单统计阶段,并没有对这些成绩数据进行深入的分析,找到有利于教学管理的信息,这是对教学信息资源的浪费。数据挖掘技术正是解决这个问题的可行而有效的方法。数据挖掘是一个新兴的边缘学科,经过十几年的努力,数据挖掘在许多领域都取得了广泛的应用。 本文着重研究了数据挖掘分类算法,对决策树ID3算法、C4.5算法的理论进行了详细的介绍和分析,通过对各种常用分类算法的比较研究,总结了各种分类算法的优点和缺点,为选择使用C4.5决策树算法提供了依据。针对C4.5算法计算量大的缺点,利用高等数学中的等价无穷小原理提出了改进的C4.5算法,减少了计算量,提高了构造决策树的效率,并用UCI中的数据集对C4.5算法和改进后的C4.5算法进行了对比试验。 为了使数据挖掘中的决策树算法应用在高职学生的成绩分析中,提出了决策树算法在高职院校学生成绩分析中的应用方案,构建了成绩分析模型;并对学生成绩数据库中的成绩进行了数据清理、数据转换、数据削减等数据预处理,处理了空缺数据、将连续值属性离散化,建立了数据挖掘数据库。使用改进后的C4.5决策树算法生成决策树,由决策树产生分类规则,从分类规则中找出影响高职学生学习成绩的主要因素,为学院教学管理部门和教师有针对性的提高教学质量提供有力的数据支持;对高职院校计算机应用技术专业的课程设置体系进行了简单的探讨。

【关键词】:
【学位授予单位】:湖南大学
【学位级别】:硕士
【学位授予年份】:2008
【分类号】:TP311.13
【目录】:

  • 摘要5-6
  • Abstract6-10
  • 插图索引10-11
  • 表格索引11-12
  • 第1章 绪论12-19
  • 1.1 论文背景12-14
  • 1.2 国内外研究现状及进展14-16
  • 1.3 课题来源及意义16-17
  • 1.4 研究内容17-18
  • 1.5 论文结构18-19
  • 第2章 相关知识19-37
  • 2.1 数据挖掘技术19-21
  • 2.1.1 数据挖掘的定义19-21
  • 2.1.2 数据挖掘的对象21
  • 2.2 数据挖掘的分类21-23
  • 2.2.1 关联分析(Association Analysis)21
  • 2.2.2 聚类分析(Clustering)21-22
  • 2.2.3 分类(Classification)22
  • 2.2.4 预测(Predication)22
  • 2.2.5 时序模式(Time.Series Pattern)22
  • 2.2.6 偏差分析(Deviation)22-23
  • 2.3 数据挖掘的过程23-24
  • 2.4 数据挖掘的方法和技术24-26
  • 2.4.1 归纳学习法24-25
  • 2.4.2 聚类方法25
  • 2.4.3 统计分析方法25
  • 2.4.4 仿生物技术25
  • 2.4.5 可视化技术25-26
  • 2.4.6 模糊数学方法26
  • 2.4.7 其它方法26
  • 2.5 数据挖掘的应用领域26-27
  • 2.6 决策树分类方法27-33
  • 2.6.1 决策树算法的发展27-29
  • 2.6.2 决策树类型与生成过程29-30
  • 2.6.3 剪枝30-31
  • 2.6.4 分类模型的评估方法31-32
  • 2.6.5 决策树评价指标32-33
  • 2.7 典型的决策树算法—ID3 算法33-36
  • 2.8 本文采用的数据挖掘方法36
  • 2.9 本章小结36-37
  • 第3章 一种改进的C4.5 算法37-53
  • 3.1 C4.5 算法37-39
  • 3.2 C4.5 如何估算错分率进行剪枝39-40
  • 3.3 C4.5 算法的应用举例40-46
  • 3.4 C4.5 决策树算法改进的原理46-50
  • 3.4.1 信息熵的简化46-47
  • 3.4.2 改进的C4.5 算法47-48
  • 3.4.3 改进的C4.5 算法应用48-50
  • 3.5 实验结果分析50-52
  • 3.5.1 生成的决策树分析50
  • 3.5.2 性能分析50-52
  • 3.6 本章小结52-53
  • 第4章 学生成绩分析系统的设计53-65
  • 4.1 高职院校成绩分析的研究内容53-54
  • 4.2 现有成绩分析的不足54-55
  • 4.3 学生成绩分析系统设计55-63
  • 4.3.1 解决方案55-57
  • 4.3.2 系统总体框架设计57-58
  • 4.3.3 数据库设计58
  • 4.3.4 数据预处理58-63
  • 4.4 编程环境63-64
  • 4.5 本章小结64-65
  • 第5章 改进的C4.5算法在学生成绩分析系统的应用65-70
  • 5.1 基于相关性属性决策算法生成决策树模型65-67
  • 5.2 所学课程之间关系的求解67-68
  • 5.3 相关性研究对教育的指导意义68-69
  • 5.4 本章小结69-70
  • 结论与展望70-72
  • 总结70-71
  • 展望71-72
  • 参考文献72-75
  • 攻读硕士学位期间发表的论文75-76
  • 致谢76
  • 下载全文 更多同类文献

    CAJ全文下载

    (如何获取全文? 欢迎:购买知网充值卡、在线充值、在线咨询)

    CAJViewer阅读器支持CAJ、PDF文件格式


    【相似文献】

    中国期刊全文数据库 前10条

    1 孟凡荣;施蕾;胡继成;;数据挖掘中分类技术的研究[J];计算机与现代化;2008年03期

    2 赵震伟;;决策树方法在学生成绩分析中的应用[J];通化师范学院学报;2008年10期

    3 杨莅沅;;决策树算法在高校成绩分析中的应用[J];潍坊学院学报;2008年04期

    4 黎仁国;;分类技术在数据挖掘中的应用研究[J];科技信息;2010年24期

    5 姚双良;;数据挖掘在高校成绩分类管理中的应用研究[J];江苏科技大学学报(社会科学版);2011年02期

    6 许晓洁;;数据挖掘技术在高校学生信息管理系统中的应用[J];中国科教创新导刊;2010年22期

    7 黄子诚;;基于决策树的数据挖掘技术[J];电脑知识与技术;2010年08期

    8 魏丽;;浅谈数据挖掘技术在大学生心理问题中的应用[J];电脑知识与技术;2009年09期

    9 冯玮;;数据挖掘在银行个人信用评估中的应用分析[J];宁德师专学报(自然科学版);2011年01期

    10 杨思清;;数据挖掘技术对提高教学质量的应用研究[J];黑龙江科技信息;2007年04期

    中国重要会议论文全文数据库 前10条

    1 王伟;殷国富;;基于数据挖掘的多维联机分析处理系统研究[A];全国先进制造技术高层论坛暨制造业自动化、信息化技术研讨会论文集[C];2005年

    2 马洪杰;曲晓飞;;数据挖掘技术和过程的特点[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年

    3 戈欣;吴晓芬;许建荣;;数据挖掘技术在放射科医疗管理中的潜在作用[A];2009中华医学会影像技术分会第十七次全国学术大会论文集[C];2009年

    4 阮鸣梁;陈维默;;数据挖掘技术的发展与应用[A];福建省科协第五届学术年会数字化制造及其它先进制造技术专题学术年会论文集[C];2005年

    5 魏元珍;杨沂凤;;数据挖掘技术及其在数字图书馆中的应用[A];网络信息资源的搜集与应用——全国高校社科信息资料研究会第十次年会论文集[C];2004年

    6 肖健;沈彩霞;;浅谈数据挖掘技术现状[A];广西计算机学会2008年年会论文集[C];2008年

    7 巩耀亮;邱晓东;孙丽君;李树强;;数据挖掘技术在企业竞争情报系统中的应用研究[A];信息时代——科技情报研究学术论文集(第三辑)[C];2008年

    8 王洪锋;;数据挖掘在客户关系管理中的应用研究[A];河南省通信学会2005年学术年会论文集[C];2005年

    9 姚小磊;彭清华;;数据挖掘技术在中医眼科应用的设想[A];中华中医药学会第七次眼科学术交流会论文汇编[C];2008年

    10 张婧;;数据挖掘技术在进销存系统中的应用[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(下)[C];2006年

    中国重要报纸全文数据库 前10条

    1 诺达咨询高级咨询顾问 周连升;[N];通信产业报;2007年

    2 王锐 白玲 龙波 马德涛;[N];中国测绘报;2007年

    3 陈晓 山西财经大学教师;[N];山西经济日报;2010年

    4 记者 吕贤如;[N];光明日报;2006年

    5 主持人 李禾;[N];科技日报;2007年

    6 首之;[N];金融时报;2006年

    7 刘红岩、何军;[N];中国计算机报;2003年

    8 ;[N];中国高新技术产业导报;2001年

    9 徐扬;[N];中国计算机报;2002年

    10 山西银行学校 王林芳;[N];山西科技报;2005年

    中国博士学位论文全文数据库 前10条

    1 许增福;DL环境下的信息资源管理及知识发现研究[D];哈尔滨工程大学;2005年

    2 庞淑英;三江并流带旅游地质景观数据挖掘及旅游价值评价研究[D];昆明理工大学;2008年

    3 赵晨;过程控制中的数据挖掘技术研究及其智能控制策略探讨[D];浙江大学;2005年

    4 高清东;复杂供矿条件矿山技术指标整体动态优化系统及应用[D];北京科技大学;2005年

    5 李兴;高光谱数据库及数据挖掘研究[D];中国科学院研究生院(遥感应用研究所);2006年

    6 王玉峰;变电站瞬态电磁环境及微机保护系统EMC研究[D];大连理工大学;2007年

    7 潘海天;数据挖掘技术在聚合过程建模与控制的应用研究[D];浙江大学;2003年

    8 程其云;基于数据挖掘的电力短期负荷预测模型及方法的研究[D];重庆大学;2004年

    9 束志恒;化学化工数据挖掘技术的研究[D];浙江大学;2005年

    10 孙蕾;医学图像智能挖掘关键技术研究[D];西北大学;2005年

    中国硕士学位论文全文数据库 前10条

    1 郭庆;数据挖掘技术在人力资源统计信息系统中的应用研究[D];暨南大学;2007年

    2 黄芳;基于数据挖掘的决策树技术在成绩分析中的应用研究[D];山东大学;2009年

    3 张兴科;基于决策树的应用研究[D];合肥工业大学;2007年

    4 李明壮;基于决策树的数据挖掘算法研究与应用[D];中国石油大学;2008年

    5 于徽;数据挖掘在图书馆用户行为分析中的应用研究[D];北方工业大学;2009年

    6 任丽君;数据挖掘在大学生心理问题中的应用研究[D];华东师范大学;2006年

    7 殷杰;数据挖掘在医疗信息分析中的研究与应用[D];重庆大学;2007年

    8 杨思清;数据仓库在教育评价系统中的应用研究[D];安徽理工大学;2007年

    9 吴俊;数据挖掘技术在公安出入境管理中的应用研究[D];合肥工业大学;2006年

    10 云玉屏;基于C4.5算法的数据挖掘应用研究[D];哈尔滨理工大学;2008年


      本文关键词:基于决策树算法的考试成绩分析系统的研究与开发,,由笔耕文化传播整理发布。



    本文编号:128016

    资料下载
    论文发表

    本文链接:https://www.wllwen.com/guanlilunwen/tongjijuecelunwen/128016.html


    Copyright(c)文论论文网All Rights Reserved | 网站地图 |

    版权申明:资料由用户13c0d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com