大数据环境下校园网行为挖掘关键问题的研究与应用
本文关键词:大数据环境下校园网行为挖掘关键问题的研究与应用 出处:《郑州轻工业学院》2017年硕士论文 论文类型:学位论文
更多相关文章: 网络 网络行为 数据挖掘 大数据 成绩预测 回归预测 决策树
【摘要】:互联网对人们的日常生活有着重要的影响,随着人们使用互联网的方式方法和应用类型日趋多元化,由此产生的用户网络行为数据量也在迅速增长。从海量的网络行为数据中挖掘出可用的信息,不仅具有很大的研究价值和商业价值,还可以为政府提供决策支持,为人们的生产和生活提供指导依据。本文主要在大数据环境下围绕网络行为数据采集、建模、分析和挖掘开展了系统性的研究,结合学生学习成绩进行数据挖掘,分析了网络行为对学习成绩的影响。(1)在数据采集方面,针对在万兆网络环境中使用通用服务器采集数据包存在性能不足这一问题,从软硬件两方面对问题进行了分析,并对近年国际上新出现的报文捕获方案进行了对比试验,给出了在万兆网络环境中使用通用服务器线速采集数据包的方法,并对协议识别方法进行了研究。(2)在描述性分析阶段,针对在大数据环境下分析观测网络行为数据存在难度大的问题,使用Pentaho平台对数据进行了清洗转换,实现了一个WEB端的可视化观测环境,设计了多维分析模型,满足了研究工作中描述性分析的需要。(3)在指标运算方面,针对使用传统方法处理海量网络行为数据存在效率低的问题,使用Pentaho平台调用Hadoop组件和R插件的方法对采集到的网络行为数据进行并行运算,并利用颗粒度放大方法和箱线图法对网络行为数据进行归约,解决了数据处理过程中处理效率低的问题。(4)利用网络行为指标和学生成绩数据开展了挖掘研究工作,采用线性支持向量机(Linear SVM)、梯度上升树(Gradient Boosted Trees,GBT)和K最近邻(KNN)等算法检验了学生的学习能力对学习成绩的影响程度,利用C4.5决策树挖掘出了网络行为对课程成绩和学习绩点的影响,找出了对学习影响较大的几种网络应用,并给出了需要对学生进行干预的阈值。
[Abstract]:This paper analyzes the problem of network behavior data acquisition , modeling , analysis and mining by using the method of collecting , modeling , analyzing and mining the network behavior data in the environment of large data .
【学位授予单位】:郑州轻工业学院
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP311.13
【参考文献】
相关期刊论文 前10条
1 程珊;钮焱;李军;;基于网络资源的kNN网络流量分类模型的研究[J];湖北工业大学学报;2016年04期
2 解军;邢进生;;基于KNN算法的新浪微博用户行为分析及预测[J];山西师范大学学报(自然科学版);2016年02期
3 李洪奇;杨中国;朱丽萍;刘蔷;;基于数据集特征的KNN最优K值预测方法[J];计算机应用与软件;2016年06期
4 TANG Lu;YAN JinLi;SUN ZhiGang;LI Tao;ZHANG MinXuan;;Towards high-performance packet processing on commodity multi-cores: current issues and future directions[J];Science China(Information Sciences);2015年12期
5 陈婧敏;;基于KNN回归的短时交通流预测[J];微型电脑应用;2015年09期
6 赵金楼;成俊会;;基于SNA的突发事件微博舆情传播网络结构分析——以“4.20四川雅安地震”为例[J];管理评论;2015年01期
7 刘滨;张静远;刘强;赵静阳;李寒;徐巍巍;;微博分析研究综述[J];河北科技大学学报;2015年01期
8 李永娜;;基于支持向量机的回归预测综述[J];信息通信;2014年11期
9 冯登国;张敏;李昊;;大数据安全与隐私保护[J];计算机学报;2014年01期
10 路荣;项亮;刘明荣;杨青;;基于隐主题分析和文本聚类的微博客中新闻话题的发现[J];模式识别与人工智能;2012年03期
相关博士学位论文 前1条
1 乔媛媛;基于Hadoop的网络流量分析系统的研究与应用[D];北京邮电大学;2014年
相关硕士学位论文 前5条
1 马仕玉;聚类算法及其在校园网用户行为分析中的应用[D];重庆交通大学;2015年
2 王帅;情感分析的特征提取算法与观点的聚类算法研究[D];昆明理工大学;2015年
3 郝增勇;基于Hadoop用户行为分析系统设计与实现[D];北京交通大学;2014年
4 马丽娇;用户网络行为分析系统的设计与实现[D];北京邮电大学;2014年
5 刘志刚;非参数回归的研究及其应用[D];温州大学;2012年
,本文编号:1396364
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/1396364.html