校园网用户行为信息的预处理与聚类方法研究
本文关键词:校园网用户行为信息的预处理与聚类方法研究,由笔耕文化传播整理发布。
【摘要】:随着互联网的快速发展与普及,网络应用已深入人们的生活。校园网作为互联网的重要组成部分,在我国高校教育中占着举足轻重的地位。校园网用户数量快速增长,一些网络应用与管理的问题也开始暴露。校园网中用户群体在网络活动产生了海量的网络数据,利用数据挖掘技术对校园网中用户行为的日志文件进行分析,对于高校教学管理活动具有重要的应用价值。论文旨在通过对校园网日志文件中的用户网络行为数据进行挖掘,以获取网络用户群体的网络行为规律,为校园网管理者制定有效策略来引导用户进行合理的网络活动提供支持。目前校园网用户行为信息的分析方法,往往只注重于聚类算法的算法设计,没有充分考虑校园网用户网络行为各属性之间的关系,而研究过程中选用的聚类算法也多局限于校园网用户行为分析中传统算法的应用与改进。论文根据校园网用户网络行为的特点,提出有效结合网络用户数据特点的预处理方式,并在此基础上,引入基于图论的子空间聚类方法,结合线性惯性权重的粒子群聚类算法,应用于预处理后所得数据,得出有效的校园网用户网络行为模式。具体研究内容如下:(1)研究现有校园网用户行为信息分析方法,包含统计方法和聚类方法中的预处理过程和聚类过程。并对常用的聚类算法及其性能进行了介绍。(2)针对校园网中用户行为信息数据特点,结合现有预处理方法,提出适用于校园网用户网络行为数据的新的预处理方法,解决现有分析方法中只能分析单一属性,不能将不同属性进行融合分析的问题。(3)根据校园网用户行为信息数据特点,在聚类过程中引入基于图论的子空间聚类方法,将研究对象的聚类问题转化为无向加权图的顶点分割问题,在此基础上对原始研究数据经过预处理后所得的距离矩阵提取特征矩阵,实现对校园网网络数据中高维数据的有效降维,并在此基础上引入带有线性惯性权重的粒子群聚类算法,完成校园网用户行为信息的分析。本文的创新点包括:(1)提出针对校园网用户行为信息的归一化加权的预处理方法,完成研究对象不同属性数据的融合分析。(2)在校园网用户行为信息分析中提出将子空间概念和粒子群聚类相结合的聚类算法,完成研究数据的有效降维,在一定程度上避免常用聚类算法容易陷入局部最优解的问题,实现了对研究对象的聚类。实验结果表明,本文所提出的预处理方法可以完成研究数据中不同属性的融合,实现对校园网对象的融合分析。在此基础上引入基于子空间的粒子群聚类算法,对比现有校园网用户行为信息研究方法,降低了算法的时间复杂度,避免了中心点选择的敏感性,增强了高位数据的处理能力,实现了聚类结果的稳定性,得出了更真实的聚类结果,为校园网用户行为信息研究提供了新的思路。
【关键词】:网络行为分析 归一化加权 子空间聚类 校园网用户
【学位授予单位】:重庆交通大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP393.18;TP311.13
【目录】:
- 摘要4-6
- ABSTRACT6-11
- 第一章 绪论11-15
- 1.1 研究背景11
- 1.2 研究意义11-12
- 1.3 课题研究现状12-13
- 1.4 论文主要工作及创新点13-14
- 1.5 论文结构14-15
- 第二章 校园网用户行为信息分析方法15-27
- 2.1 校园网用户行为定义15
- 2.2 数据挖掘15-17
- 2.2.1 基本概念15-16
- 2.2.2 运行过程16-17
- 2.3 统计方法17-18
- 2.4 预处理方法18-20
- 2.4.1 数据清理19
- 2.4.2 数据集成和变换19-20
- 2.4.3 数据归约20
- 2.5 聚类方法20-26
- 2.5.1 基本概念20-21
- 2.5.2 分析方法21-24
- 2.5.3 常用聚类算法比较分析24-26
- 2.6 本章小结26-27
- 第三章 归一化加权预处理方法27-31
- 3.1 常用校园网用户行为信息预处理方法分析27-28
- 3.2 归一化加权预处理方法28-29
- 3.2.1 数据的标准化处理28-29
- 3.2.2 加权归一化29
- 3.3 改进后的预处理流程29-30
- 3.4 本章小结30-31
- 第四章 基于子空间的粒子群聚类方法31-43
- 4.1 常用校园网用户行为信息数据分析方法分析31
- 4.2 基于图论的子空间聚类方法31-36
- 4.2.1 图论相关技术32-33
- 4.2.2 数学解释33-34
- 4.2.3 相关矩阵34-35
- 4.2.4 子空间聚类算法流程35-36
- 4.3 粒子群聚类算法36-40
- 4.3.1 基本粒子群算法36-38
- 4.3.2 标准粒子群算法38
- 4.3.3 参数分析38-39
- 4.3.4 算法流程39-40
- 4.3.5 改进惯性权重40
- 4.4 校园网用户行为分析聚类算法40-41
- 4.4.1 算法流程40-41
- 4.4.2 算法时间复杂度分析41
- 4.5 本章小结41-43
- 第五章 预处理和聚类方法应用与分析43-57
- 5.1 校园网用户行为信息分析背景43-45
- 5.1.1 数据来源43-44
- 5.1.2 数据特点44-45
- 5.2 数据预处理45-49
- 5.2.1 数据清理和特征提取45-46
- 5.2.2 数据转换46-48
- 5.2.3 数据标准化48-49
- 5.2.4 加权归一化49
- 5.3 聚类应用及结果分析49-56
- 5.3.1 计算距离矩阵49-50
- 5.3.2 算法运行环境及参数配置50
- 5.3.3 聚类结果50-53
- 5.3.4 聚类结果分析53-54
- 5.3.5 算法对比54-56
- 5.4 本章小结56-57
- 第六章 总结与展望57-59
- 6.1 研究工作总结57-58
- 6.2 展望58-59
- 致谢59-61
- 参考文献61-65
- 在学期间发表的论文和取得的学术成果65
【相似文献】
中国期刊全文数据库 前10条
1 胡敏;探询校园网新药[J];中国计算机用户;2002年43期
2 韩国彬,梁晓龙;校园网在教学过程中出现的几个问题[J];河北青年管理干部学院学报;2004年03期
3 罗维刚;对校园网实行可运营改造[J];中国计算机用户;2004年27期
4 熊国清;西南民族学院新校区校园网解决方案[J];通信与信息技术;2005年02期
5 钟建林;试论校园网“软网源”建设的若干原则[J];广西梧州师范高等专科学校学报;2005年01期
6 王志斌;;浅谈校园网建设与应用[J];中国教育研究论丛;2006年00期
7 林剑敏;;新型大学校园网络建设的探讨——以福建农林大学校园网为例[J];硅谷;2009年16期
8 于贵;;校园网内部安全防范浅谈[J];长江大学学报(自然科学版);2011年02期
9 伍绍佳;;市级电大校园网升级改造的研究[J];软件;2013年01期
10 荆宜青;罗康;;云存储在高校校园网中的应用[J];信息系统工程;2013年04期
中国重要会议论文全文数据库 前6条
1 夏洪刚;;武汉高校校园网与公众网互联组网的解决方案[A];武汉市首届学术年会通信学会2004年学术年会论文集[C];2004年
2 李栋;;校园网千兆交换机的故障与解决[A];煤矿自动化与信息化——第21届全国煤矿自动化与信息化学术会议暨第3届中国煤矿信息化与自动化高层论坛论文集(下册)[C];2011年
3 黄曦东;裴克军;;论高校校园网中病毒的有效预防和查杀[A];第七届全国体育科学大会论文摘要汇编(二)[C];2004年
4 刘瑾;王振旗;邹迎春;胡媛媛;;校园网用户上网行为分析系统的设计[A];第一届中国高校通信类院系学术研讨会论文集[C];2007年
5 汤薇;曾艳;;构建校园网搜索引擎必要性分析[A];广西计算机学会2008年年会论文集[C];2008年
6 曹东亚;岳江红;金培莉;;校园网IPv6技术部署方案与实现[A];中国高等教育学会教育信息化分会第十次学术年会论文集[C];2010年
中国重要报纸全文数据库 前10条
1 李理;校园网改造从细致到品质[N];中国计算机报;2005年
2 本报记者 于洋;校园网的今天和明天[N];网络世界;2005年
3 子知;多元绑定认证计费 高校校园网运营管理新方向[N];中国电脑教育报;2004年
4 ;多元绑定的认证计费高校校园网运营的必由之路[N];通信产业报;2003年
5 熊国清;“实战”校园网[N];计算机世界;2005年
6 熊国清;校园网认证分而治之[N];计算机世界;2005年
7 君玉;可管理、可增值、可持续发展[N];中国计算机报;2006年
8 ;神州数码网络搭建可运营校园网[N];计算机世界;2003年
9 谢佳;浙江高校将完善校园网用户备案制度[N];人民公安报;2008年
10 潘慧英;清华校园网升级到万兆[N];中国计算机报;2003年
中国博士学位论文全文数据库 前1条
1 邱全杰;基于IPv6的校园网技术升级及性能测量研究[D];重庆大学;2012年
中国硕士学位论文全文数据库 前10条
1 董献芬;民办高校校园网升级改造建设研究[D];山东大学;2016年
2 邱霜玲;基于IPv6的校园网组网设计与实现[D];西南交通大学;2015年
3 马辉;天津未来小学校园网流量控制方案设计与实现[D];大连理工大学;2015年
4 刘小娜;基于校园网用户账号的多路径选择设计与实现[D];郑州大学;2016年
5 宋坤;校园网用户行为信息的预处理与聚类方法研究[D];重庆交通大学;2016年
6 车杰;独立学院校园网建设的规划与研究[D];吉林大学;2011年
7 孙竞;河北石油职业技术学院校园网方案的设计与研究[D];天津大学;2005年
8 梅挺;校园网及应用的设计与实现[D];四川大学;2003年
9 林奕多;黑龙江煤炭职业技术学院智慧校园方案的设计与实现[D];黑龙江大学;2015年
10 程杰;校园网统一信息系统的设计与实现[D];华东师范大学;2011年
本文关键词:校园网用户行为信息的预处理与聚类方法研究,由笔耕文化传播整理发布。
,本文编号:467266
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/467266.html