当前位置:主页 > 管理论文 > 移动网络论文 >

基于聚类技术的校园网络用户行为数据分析研究

发布时间:2017-10-16 09:03

  本文关键词:基于聚类技术的校园网络用户行为数据分析研究


  更多相关文章: 校园网络用户 行为分析 数据挖掘 兴趣度矩阵 相似度计算 K-means算法


【摘要】:目前,随着校园网络用户个性化需求的日益增长,网络信息服务的使用从集中统一型向分布式个性化演进,校园网络中的用户有着各自的上网习惯和兴趣,各用户使用网络的时间、服务及关注的内容焦点都有差异。校园网络服务也从传统的网络聊天、浏览新闻网页等方面向更细致、更个性化的服务转变,如网络购物、网络课堂、娱乐游戏等,这为校园网络用户提供了极大的便利。然而,现阶段的个性化校园网络用户服务在及时性、稳定性等方面仍无法满足实际应用的需求,因此,为校园网用户提供更加及时、更高质量的网络服务,成为网络用户行为的研究方向之一。本文将借助挖掘处理、聚类分析技术来研究网络用户的行为,并进一步分析网络用户的兴趣和需求,以优化用户体验。高等院校内的校园网使用者有着比较高的文化教育水平和专业水平,并且不同的用户有着不同的网络使用习惯以及更加个性化的网络需求,因此,在校园网中获取的数据相比社会网络数据有着更高的可研究性。本文的主要研究工作和创新点概括如下:1.本文梳理了近年来国内外有关网络用户行为的分析研究现状,归纳总结出校园网络用户行为的概念及特点、数据挖掘的流程和方法,并根据校园网络用户行为分析数据的特点,选择了K-means聚类算法进行改进,并用于聚类分析。2.本文在传统经典的K-means聚类算法的基础上,提出了基于兴趣矩阵的相似度计算方法。该算法通过构造用户兴趣度矩阵的方式改进了用户间相似度的计算方法,即用户的上网行为以矩阵的形式表示出来,其中,每个矩阵有七行,每一行表示日期的记录,即(周一、周二...周日),每个矩阵元素表示在某影响条件分类下网络使用量占当天总使用量的比重值,每一列表示网络用户在同一影响条件分类下,不同日期的网络使用量占当天总使用量的比重值,进而使用聚类技术,对校园局域网用户行为进行相似度计算。该算法在一定程度上降低了无效数据的影响,提高了用户行为相似度聚类的时效性和有效性,能够较好的应用于校园局域网用户行为的具体研究中。3.本文提出了对影响用户行为的条件进行筛选的算法,即根据用户行为随条件变化的波动情况来对该条件进行有效性判定。在校园局域网中,影响用户行为的可能条件比较多,例如上网的时间和上网位置等等,因此,能够科学的筛选出有效的影响条件是校园局域网用户行为研究的一个重要部分。相对于传统的人工的筛选方法来讲,该方法减少了人为干预的主观随意性,条件筛选结果更为严谨。
【关键词】:校园网络用户 行为分析 数据挖掘 兴趣度矩阵 相似度计算 K-means算法
【学位授予单位】:山东师范大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP311.13;TP393.18
【目录】:
  • 摘要6-7
  • ABSTRACT7-9
  • 第一章 绪论9-13
  • 1.1 课题研究背景与意义9-10
  • 1.2 国内外研究现状10-11
  • 1.2.1 网络用户行为的国内外研究现状10
  • 1.2.2 聚类算法的相关研究现状10-11
  • 1.3 本文主要研究内容11
  • 1.4 论文组织结构11-13
  • 第二章 校园网络用户及用户行为分析概述13-17
  • 2.1 校园网络用户13-14
  • 2.1.1 校园网络用户的概念及特点13
  • 2.1.2 校园网络用户兴趣13-14
  • 2.1.3 校园网络用户分类14
  • 2.2 校园网络用户行为14-16
  • 2.2.1 校园网络用户行为概念及特点14-15
  • 2.2.2 用户行为分析数据采集15-16
  • 2.3 本章小节16-17
  • 第三章 校园网络用户行为分析的挖掘技术及数据处理17-31
  • 3.1 数据挖掘17-20
  • 3.1.1 数据挖掘的概念及目的17
  • 3.1.2 数据挖掘方法17-19
  • 3.1.3 数据挖掘流程19-20
  • 3.2 数据预处理20-23
  • 3.2.1 数据预处理的重要意义20
  • 3.2.2 数据清洗20-22
  • 3.2.3 数据规约22
  • 3.2.4 数据集成和数据变换22-23
  • 3.3 聚类分析23-25
  • 3.3.1 聚类的概念23-24
  • 3.3.2 聚类分析算法特点24
  • 3.3.3 聚类分析算法分类24-25
  • 3.4 K-means聚类算法25-30
  • 3.4.1 K-means算法基本概述25-26
  • 3.4.2 K-means算法的基本原理和思想26-27
  • 3.4.3 K-means聚类算分析27-28
  • 3.4.4 K-means聚类算法的优缺点28-30
  • 3.5 本章小结30-31
  • 第四章 校园网用户行为分析的设计方案31-35
  • 4.1 校园网络简介31
  • 4.2 校园网用户行为分析的设计31-33
  • 4.3 H3C及检测系统后台数据库概述33
  • 4.4 校园网络用户流量使用走势33-35
  • 第五章 用户兴趣矩阵相似度算法35-41
  • 5.1 校园网用户行为相关问题定义35-37
  • 5.1.1 网络使用量的表示及相关概念35-36
  • 5.1.2 校园网用户行为活跃度36-37
  • 5.2 兴趣矩阵相似度算法(IMSA)37-40
  • 5.2.1 网络用户兴趣度矩阵的构造37-39
  • 5.2.2 网络用户行为相似度的计算39-40
  • 5.3 本章小结40-41
  • 第六章 校园网络用户行为的实验分析41-45
  • 6.1 实验步骤41-42
  • 6.2 实验结果及分析42-44
  • 6.2.1 活跃度临界值的实验及影响42
  • 6.2.2 异常率的临界值的实验及影响42-43
  • 6.2.3 基于兴趣度矩阵的聚类43-44
  • 6.3 本章小结44-45
  • 第七章 总结与展望45-47
  • 7.1 总结45-46
  • 7.2 展望46-47
  • 参考文献47-49
  • 攻读硕士学位期间的主要成果49-50
  • 致谢50


本文编号:1041782

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1041782.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户013d2***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com