当前位置:主页 > 教育论文 > 职业教育论文 >

决策树和关联规则技术在高职院校招生工作中的应用研究

发布时间:2018-07-16 16:20
【摘要】:近年来,随着国家对职业教育的扶持力度不断加大,职业院校的规模迅速扩张,致使职业院校之间的竞争愈加激烈。在如此激烈的竞争中,各个职业院校要想占有一席之地就必须提高新生的报到率以及获得更多的优质生源。目前,一些院校建立了招生信息系统,希望借助于信息化的平台为招生工作提供帮助。但是在这些招生系统中,大部分仅是完成了信息统计和存储的功能,并不能解决实际的问题。而数据挖掘技术的出现,可以将存在于生源信息之间有价值的规律挖掘出来,找到影响学生报到率和生源质量优劣的因素,从而为学校的管理者科学的指导招生宣传工作、合理的制定招生政策提供帮助。本文从招生工作的实际出发,通过应用决策树和关联规则算法对学生的录取信息进行挖掘,分析研究影响学生报到率的因素。论文所完成的主要工作如下:1、研究探讨了数据挖掘的基础知识以及数据挖掘技术中的决策树和关联规则算法,并分别选取决策树算法中的ID3算法、C4.5算法和关联规则算法中的Apriori算法进一步研究分析,比较不同算法之间的差异。2、结合实际工作,对高职院校生源存档数据按照数据挖掘工作的要求进行数据预处理,保证后面的数据挖掘工作更高效、更可靠。3、对高职院校生源存档数据集分别运用C4.5算法和Apriori算法进行数据挖掘,并在WEKA平台上实现相关算法,得出相关规则和结论。通过对数据集使用上述两种不同的数据挖掘方法,可以分析研究存在于两种算法间的相关性、差异性,归纳出更符合实际需求的规则,从而为日后的招生工作提供帮助。
[Abstract]:In recent years, with the increasing support for vocational education, the scale of vocational colleges is expanding rapidly, resulting in more fierce competition between vocational colleges. In such a fierce competition, if vocational colleges want to have a place, they must improve the enrollment rate and obtain more high quality students. At present, some colleges and universities have set up enrollment information system, hoping to help recruit students with the help of information platform. But in these enrollment systems, most of them only complete the function of information statistics and storage, and can not solve the practical problems. The emergence of data mining technology can excavate the valuable rules existing in the information of students, find out the factors that affect the students' enrollment rate and the quality of students, so as to guide the enrollment propaganda work scientifically for the school managers. Make appropriate enrollment policy to help. Based on the practice of enrollment, this paper uses decision tree and association rules algorithm to mine students' admission information, and analyzes the factors that affect students' registration rate. The main work of this paper is as follows: 1. The basic knowledge of data mining, decision tree and association rule algorithm in data mining are studied. The ID3 algorithm C4.5 algorithm and the association rule algorithm Apriori algorithm in the decision tree algorithm are selected to further study and analysis, compare the differences between different algorithms. 2, combined with the actual work, The archived data of students in higher vocational colleges are preprocessed according to the requirements of data mining to ensure that the data mining work in the future is more efficient. More reliable. 3, using C4.5 algorithm and Apriori algorithm to mine the data set of higher vocational college students' archival data, and implementing the related algorithms on the WEKA platform, and draw the relevant rules and conclusions. By using the above two different data mining methods, we can analyze and study the correlation and difference between the two algorithms, sum up the rules that are more suitable to the actual demand, and provide help for the recruitment work in the future.
【学位授予单位】:郑州大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:G717.32;TP311.13

【相似文献】

相关期刊论文 前10条

1 香丽芸;浅谈数据挖掘及其应用[J];昌吉师专学报;2001年02期

2 韩海萌;信息时代的指南针——数据挖掘[J];江苏统计;2002年05期

3 林阳;数据挖掘在教育信息化中的潜在价值[J];现代教育技术;2002年01期

4 朱世武 ,崔嵬 ,张尧庭 ,谢邦昌;数据挖掘运用的理论与技术[J];统计研究;2003年08期

5 王晓涓,祁慧敏;数据挖掘漫谈[J];天中学刊;2003年02期

6 韩江;数据挖掘——极具发展潜力的新领域[J];苏州市职业大学学报;2004年01期

7 李菁菁,邵培基,黄亦潇;数据挖掘在中国的现状和发展研究[J];管理工程学报;2004年03期

8 ;中国科学院数据挖掘与知识管理学术研讨会在京举行[J];管理评论;2004年07期

9 魏瑜,陆静;数据挖掘与统计学的关系浅析[J];沿海企业与科技;2005年09期

10 单靖华;金矿就在你手中 读《数据挖掘——客户关系管理的科学与艺术》随笔[J];数据;2005年10期

相关会议论文 前10条

1 史东辉;蔡庆生;张春阳;;一种新的数据挖掘多策略方法研究[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年

2 张弦;;数据挖掘在农业中的应用[A];纪念中国农业工程学会成立30周年暨中国农业工程学会2009年学术年会(CSAE 2009)论文集[C];2009年

3 魏顺平;;教育数据挖掘:现状与趋势[A];信息化、工业化融合与服务创新——第十三届计算机模拟与信息技术学术会议论文集[C];2011年

4 关清平;沉培辉;;概率网络在数据挖掘上的应用[A];科技、工程与经济社会协调发展——中国科协第五届青年学术年会论文集[C];2004年

5 丁瑾;;基于Web数据挖掘的综述[A];山西省科学技术情报学会学术年会论文集[C];2004年

6 聂茹;田森平;;Web数据挖掘及其在电子商务中的应用[A];中南六省(区)自动化学会第24届学术年会会议论文集[C];2006年

7 李菊;王军;;数据挖掘在客户关系管理的应用[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年

8 肖阳;李启贤;;数据挖掘在中国钢铁行业中的应用[A];中国计量协会冶金分会2012年会暨能源计量与节能降耗经验交流会论文集[C];2012年

9 杨磊;王贵成;汪勇;张占胜;;SQL Server 2005在数据挖掘中的应用[A];2009年中国智能自动化会议论文集(第二分册)[C];2009年

10 谢中;邱玉辉;;面向商务网站有效性的数据挖掘方法[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年

相关重要报纸文章 前10条

1 本报记者褚宁;数据挖掘如“挖金”[N];解放日报;2002年

2 周蓉蓉;数据挖掘需要点想像力[N];计算机世界;2004年

3 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年

4 《网络世界》记者 王莹;数据挖掘保险业的新蓝海[N];网络世界;2012年

5 刘俊丽;基于地理化的网络数据挖掘与分析提升投资有效性[N];人民邮电;2014年

6 本报记者 连晓东;数据挖掘:金融信息化新热点[N];中国电子报;2002年

7 本报记者 凤小华 朱仁康;“数字挖掘软件”引领中国信息化新浪潮[N];中国电子报;2003年

8 本报记者 史延廷;“成功企业数据挖掘暨数量化管理论坛”在京举办[N];中国旅游报;2002年

9 朱小宁;数据挖掘:信息化战争的基础工程[N];解放军报;2005年

10 本报记者 王小平;从“大集中”走向数据挖掘[N];金融时报;2002年

相关博士学位论文 前10条

1 于自强;海量流数据挖掘相关问题研究[D];山东大学;2015年

2 张馨;全基因组SNP芯片应用于CNV和L0H分析的软件比对与数据挖掘[D];复旦大学;2011年

3 彭计红;基于数据挖掘的痴呆中医证的研究[D];南京中医药大学;2015年

4 李秋虹;基于MapReduce的大规模数据挖掘技术研究[D];复旦大学;2013年

5 邬文帅;基于多目标决策的数据挖掘方法评估与应用[D];电子科技大学;2015年

6 谢邦彦;整合数据挖掘与TRIZ理论的质量管理方法研究[D];首都经济贸易大学;2010年

7 何伟全;云南高校学生意外伤害因素关联规则挖掘及风险管控体系研究[D];昆明理工大学;2015年

8 段功豪;基于多结构数据挖掘的滑坡灾害预测模型研究[D];中国地质大学;2016年

9 白晓明;基于数据挖掘的复合材料宏—细观力学模型研究[D];哈尔滨工业大学;2016年

10 蓝永豪(LAM Wing Ho);基于数据挖掘技术分析当代中医名家痤疮验方经验研究[D];南京中医药大学;2016年

相关硕士学位论文 前10条

1 林仁红;基于数据挖掘的机遇识别与评价研究[D];首都经济贸易大学;2007年

2 张彦俊;游戏运营中的数据挖掘[D];复旦大学;2011年

3 王杰锋;物联网能耗数据智能分析及其应用平台设计[D];江南大学;2015年

4 刘学建;数据挖掘在电子商务推荐系统中的应用研究[D];昆明理工大学;2015年

5 戴阳阳;基于数据挖掘的金融时间序列预测研究与应用[D];江南大学;2015年

6 石思优;基于主题模型的医疗数据挖掘研究[D];广东技术师范学院;2015年

7 陈丹;移动互联网信令挖掘实现智慧营销的设计与实现应用研究[D];华南理工大学;2015年

8 陈思;基于数据挖掘的大学生客户识别模型的研究[D];昆明理工大学;2015年

9 位长帅;基于客户数据挖掘的电信客户关系管理研究[D];西南交通大学;2015年

10 安康;基于数据挖掘的商业银行客户关系管理研究[D];兰州交通大学;2014年



本文编号:2126940

资料下载
论文发表

本文链接:https://www.wllwen.com/jiaoyulunwen/zhiyejiaoyulunwen/2126940.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e1747***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com