聚类算法及其在校园网用户行为分析中的应用
发布时间:2017-07-29 19:14
本文关键词:聚类算法及其在校园网用户行为分析中的应用
更多相关文章: 网络用户行为 聚类算法 K-mediods算法 SOM算法
【摘要】:校园网作为互联网的重要分支,其网络用户行为具有独有的特性,尽管聚类算法在网络用户行为分析中的应用较为广泛,但分析校园网用户的会话行为数据时,仍存在一定的局限性。本文在研究聚类算法的基础上,选取适用于校园网络用户行为分析的聚类算法,对其进行改进,并应用到校园网络用户行为分析中。具体研究内容如下:①研究聚类算法,包括经典聚类算法和现有的改进算法,并对多种典型聚类算法的性能进行比较分析。②提出了基于最远距离选取初始聚类中心和聚类中心迭代局部搜索策略的K-mediods改进算法。针对K-mediods算法依赖初始中心和收敛速度较慢的缺陷,从初始中心选取和迭代搜索策略两个方面对K-mediods算法进行改进,并分析改进算法时间复杂度。③提出了在输入层增加降维层和基于权值变化的训练停止条件的SOM改进算法。针对SOM算法不能直接应用到本文校园网络用户行为数据的分析中及其训练停止条件的设置对收敛速度的影响,从输入层模型和训练停止两个方面对SOM算法进行改进,并分析改进算法时间复杂度。④实现了对Dr.com宽带认证服务器端的日志记录预处理。预处理操作包括数据清洗、数据提取、数据转换及数据存储。⑤完成了两种改进算法的仿真实验和性能对比分析,并应用于校园网用户行为分析中,获得了校园网用户上网行为规律。从算法有效性及稳定性方面对两种改进算法在应用中的性能进行验证,分析不同维度数据集的聚类结果,获得能够反映校园网络用户上网行为的规律特征,总结两种改进算法的特点。实验结果表明,本文K-mediods改进算法的时间复杂度是传统K-mediods算法的1/k2,有效性和稳定性都能够取得明显的效果,稳定性提高11%,同时改进算法在校园网络用户行为的应用中,聚类结果具有更好的可解释性。SOM改进算法在时间复杂度上虽然没有改善,但其聚类有效性和稳定性均能取得与K-mediods改进算法相近的效果,聚类结果可解释性也能与K-mediods改进算法相匹配。这两种方法均可用于校园网用户上网行为分析。
【关键词】:网络用户行为 聚类算法 K-mediods算法 SOM算法
【学位授予单位】:重庆交通大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP393.18;TP311.13
【目录】:
- 摘要4-5
- Abstract5-9
- 第一章 绪论9-15
- 1.1 选题背景及意义9-10
- 1.2 课题研究现状10-12
- 1.2.1 校园网络用户行为研究现状10-11
- 1.2.2 校园网络用户行为分析方法研究现状11-12
- 1.3 论文主要工作及创新12-13
- 1.4 论文结构安排13-15
- 第二章 聚类算法研究15-26
- 2.1 聚类算法基础理论15-21
- 2.1.1 聚类算法描述15
- 2.1.2 相似性度量15-17
- 2.1.3 聚类算法有效性评价17-21
- 2.2 常用聚类算法研究21-24
- 2.2.1 基于划分的聚类算法21-22
- 2.2.2 基于层次的聚类算法22-23
- 2.2.3 基于密度的聚类算法23
- 2.2.4 基于网格的聚类算法23-24
- 2.2.5 基于模型的聚类算法24
- 2.3 聚类算法分析总结24-25
- 2.4 本章小结25-26
- 第三章 K-mediods算法及其改进26-34
- 3.1 K-mediods聚类算法26-28
- 3.1.1 K-mediods算法思想26
- 3.1.2 K-mediods聚类算法步骤及流程26-27
- 3.1.3 K-mediods聚类算法的优缺点27-28
- 3.2 K-mediods算法改进28-32
- 3.2.1 基于最远距离的初始中心选取29-31
- 3.2.2 聚类中心迭代局部搜索策略31-32
- 3.3 K-mediods改进算法时间复杂度分析32-33
- 3.4 本章小结33-34
- 第四章 SOM算法及其改进34-44
- 4.1 SOM算法34-38
- 4.1.1 SOM算法模型34-35
- 4.1.2 SOM模型训练步骤35-36
- 4.1.3 SOM算法优缺点36-38
- 4.2 SOM算法改进38-42
- 4.2.1 输入层模型改进38-40
- 4.2.2 训练停止条件改进40-41
- 4.2.3 SOM改进算法步骤及流程图41-42
- 4.3 SOM改进算法时间复杂度分析42-43
- 4.4 本章小结43-44
- 第五章 算法仿真及其在校园网用户行为分析中的应用44-65
- 5.1 校园网网络行为分析背景44-47
- 5.1.1 校园网数据来源环境44
- 5.1.2 Dr.com系统日志解析44-45
- 5.1.3 数据内容及特点45-47
- 5.2 校园网络系统日志数据预处理47-51
- 5.2.1 数据清洗47-48
- 5.2.2 数据特征提取48
- 5.2.3 数据转换48-50
- 5.2.4 建立数据仓库50-51
- 5.3 算法仿真环境51
- 5.4 K-mediods改进算法仿真51-53
- 5.4.1 有效性分析51-52
- 5.4.2 稳定性分析52-53
- 5.5 SOM改进算法仿真53-54
- 5.5.1 有效性分析53-54
- 5.5.2 稳定性分析54
- 5.6 K-mediods改进算法与SOM改进算法应用分析54-64
- 5.6.1 K-mediods改进算法的应用54-60
- 5.6.2 SOM改进算法的应用60-63
- 5.6.3 改进算法的应用总结63-64
- 5.7 本章小结64-65
- 第六章 总结与展望65-67
- 6.1 研究工作总结65-66
- 6.2 展望66-67
- 致谢67-68
- 参考文献68-72
- 在学期间发表的论文和取得的学术成果72
【参考文献】
中国期刊全文数据库 前2条
1 童先群;周忠眉;;基于层次聚类法的Entropy-KNN算法[J];漳州师范学院学报(自然科学版);2012年01期
2 杨晨;闫薇;;利用SOM网络模型进行聚类研究[J];网络安全技术与应用;2014年02期
,本文编号:590671
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/590671.html