应用导向的高校计算机课程数据挖掘
发布时间:2021-01-02 19:08
在当代信息化的年代里,文本数据在高速的增长,人们逐渐进入到了信息过载的时代。计算机技术的应用已经渗入到了人类社会生活的各个方面,计算机应用能力掌握程度直接影响着其工作和学习的效率和质量。随着数据的高速增长,如何有效的获取有用的信息,数据挖掘技术在这方面发挥着巨大作用。它可以帮助人们是把隐藏在看上去杂乱无章的数据中通过信息集中、萃取和提炼等方法挖掘出来,以找出所研究对象的内在规律,并提供价值参考,帮助人们快速、准确的做出决策判断。本文依据目前高校毕业生面临就业的现状和当前国内高等教育现状,包括高校新生的增长情况和高校毕业生面临就业难的问题,对各类招聘网站数据进行数据抓取,分析当前IT行业用人单位对计算机应用能力的需求,就目前国内各行业招聘信息及高校毕业生就业状况,预测未来社会对计算机人才所需求,对IT行业就业未来发展趋势简要分析。本文提出了一种新的衡量文本相似度的方法Adaptive Metric Selection(AMS),通过对分词后的文本信息进行特征提取、降维,使用自适应选择方法AMS对数据进行相似度衡量,再进行聚类分析,实验表明自适应指标选择AMS方法在距离相似度量方面有着比较...
【文章来源】:广州大学广东省
【文章页数】:61 页
【学位级别】:硕士
【部分图文】:
图2-1分词前的例子Fig.2-1Examplebeforethesplit
图2-2分词后的例子Fig.2-2Exampleafterthesplit
图 2-3 一致矩阵的构造流程图Fig.2-3 The flow chart of the structure of the consistent matrix维后的数据,经过 k 均值算法得到 5 个簇,使得 1500 篇文章都被一个。利用这些聚类类别,通过转化把向量矢量转变为矩阵的形
【参考文献】:
期刊论文
[1]基于信息融合的网页文本聚类距离选择方法[J]. 张少宏,李继巧,罗嘉怡,谢冬青,王婧. 广州大学学报(自然科学版). 2016(01)
[2]关于数据挖掘研究现状及发展趋势的探究[J]. 任新社,陈静远. 信息通信. 2016(02)
[3]基于Active Learning的中文分词领域自适应[J]. 许华婷,张玉洁,杨晓晖,单华,徐金安,陈钰枫. 中文信息学报. 2015(05)
[4]数据挖掘研究现状及发展趋势[J]. 张莉. 赤峰学院学报(自然科学版). 2014(18)
[5]对计算机专业教学改革的思考[J]. 张巍. 黑龙江科学. 2013(10)
[6]垂直搜索引擎中分词技术的算法研究[J]. 邹嵩,赵诗阳,周新志. 计算机技术与发展. 2012(02)
[7]计算机专业人才需求调研报告[J]. 孙中胜,孟浩. 计算机教育. 2011(19)
[8]文本分类中特征项权重算法的改进[J]. 卢志翔,蒙丽莉. 柳州师专学报. 2011(04)
[9]数据挖掘研究现状及发展趋势[J]. 王惠中,彭安群. 工矿自动化. 2011(02)
[10]从Web网页上获取一价事件常识的方法[J]. 杨帆,孙强. 科学技术与工程. 2010(25)
硕士论文
[1]基于相关性的癌症特征选择及分类算法研究[D]. 彭湘华.湖南大学 2012
[2]基于机器学习的经济行业分类方法研究[D]. 王垚尧.哈尔滨工业大学 2011
[3]中文文本分类中互信息特征选择方法研究[D]. 邓彩凤.西南大学 2011
[4]XML文档分类方法的研究及其应用[D]. 田伟.大连理工大学 2009
[5]基于Web文本内容的信息过滤系统的研究与设计[D]. 刘七.南京理工大学 2004
本文编号:2953470
【文章来源】:广州大学广东省
【文章页数】:61 页
【学位级别】:硕士
【部分图文】:
图2-1分词前的例子Fig.2-1Examplebeforethesplit
图2-2分词后的例子Fig.2-2Exampleafterthesplit
图 2-3 一致矩阵的构造流程图Fig.2-3 The flow chart of the structure of the consistent matrix维后的数据,经过 k 均值算法得到 5 个簇,使得 1500 篇文章都被一个。利用这些聚类类别,通过转化把向量矢量转变为矩阵的形
【参考文献】:
期刊论文
[1]基于信息融合的网页文本聚类距离选择方法[J]. 张少宏,李继巧,罗嘉怡,谢冬青,王婧. 广州大学学报(自然科学版). 2016(01)
[2]关于数据挖掘研究现状及发展趋势的探究[J]. 任新社,陈静远. 信息通信. 2016(02)
[3]基于Active Learning的中文分词领域自适应[J]. 许华婷,张玉洁,杨晓晖,单华,徐金安,陈钰枫. 中文信息学报. 2015(05)
[4]数据挖掘研究现状及发展趋势[J]. 张莉. 赤峰学院学报(自然科学版). 2014(18)
[5]对计算机专业教学改革的思考[J]. 张巍. 黑龙江科学. 2013(10)
[6]垂直搜索引擎中分词技术的算法研究[J]. 邹嵩,赵诗阳,周新志. 计算机技术与发展. 2012(02)
[7]计算机专业人才需求调研报告[J]. 孙中胜,孟浩. 计算机教育. 2011(19)
[8]文本分类中特征项权重算法的改进[J]. 卢志翔,蒙丽莉. 柳州师专学报. 2011(04)
[9]数据挖掘研究现状及发展趋势[J]. 王惠中,彭安群. 工矿自动化. 2011(02)
[10]从Web网页上获取一价事件常识的方法[J]. 杨帆,孙强. 科学技术与工程. 2010(25)
硕士论文
[1]基于相关性的癌症特征选择及分类算法研究[D]. 彭湘华.湖南大学 2012
[2]基于机器学习的经济行业分类方法研究[D]. 王垚尧.哈尔滨工业大学 2011
[3]中文文本分类中互信息特征选择方法研究[D]. 邓彩凤.西南大学 2011
[4]XML文档分类方法的研究及其应用[D]. 田伟.大连理工大学 2009
[5]基于Web文本内容的信息过滤系统的研究与设计[D]. 刘七.南京理工大学 2004
本文编号:2953470
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2953470.html