当前位置:主页 > 科技论文 > 软件论文 >

基于用户上网日志的数据挖掘技术研究

发布时间:2017-04-11 13:09

  本文关键词:基于用户上网日志的数据挖掘技术研究,,由笔耕文化传播整理发布。


【摘要】:伴随着数据挖掘的技术的成熟发展,运用数据挖掘技术来对校园网进行研究具有很大的应用价值,对用户的上网日志分析是网络研究和管理的主要方向。本文研究的主要内容是利用校园网学生的上网行为数据进行分析,挖掘出用户的上网时段、用户访问网站类型等上网行为特征。旨在通过分析学生的行为日志记录的规律,掌握和预测校园网的运行状况,为校园网络建设和管理给出科学的依据。论文所做的工作具体如下:首先对系统分析工作进行概述,进行校园网中用户的上网日志数据的采集,通过数据预处理、数据转换等得到适合分析的数据属性集合,将这些数据存放在数据库中以供挖掘使用。然后对本文所采用的关联规则Apriori算法做分析与研究,分析算法的不足之处。引用负关联规则,将两种算法结合在一起,分析其可行性,并且提出自己的改进思想,改进算法只需要扫描一次数据库,大大提高了算法的运行速度,并通过实验对比验证了改进算法的有效性。最后对校园网的学生上网行为从多方面进行研究,包括分时段在线人数分析、用户访问网站分析、不同类别用户上网行为分析等。其中,在对用户访问网站分析和不同类别用户上网分析时,利用Weka数据挖掘平台进行分析,得到相关用户的上网特点。通过对学生的上网行为分析,可以对校园网的优化给出合理的建议。此研究也可以应用在商业领域上,为顾客提供个性化服务,增强企业的竞争力。
【关键词】:数据挖掘 用户上网行为 关联规则 Apriori算法
【学位授予单位】:贵州大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP311.13
【目录】:
  • 摘要4-5
  • Abstract5-7
  • 第一章 绪论7-13
  • 1.1 课题的研究背景7-8
  • 1.2 课题的研究意义8-9
  • 1.3 国内外的研究现状9-11
  • 1.3.1 国内研究现状9-10
  • 1.3.2 国外研究现状10-11
  • 1.4 本文的研究内容和文章结构11-12
  • 1.4.1 主要的研究内容11-12
  • 1.4.2 文章结构12
  • 1.4.3 论文的主要创新点12
  • 1.5 本章小结12-13
  • 第二章 校园网用户上网日志分析与数据挖掘13-25
  • 2.1 网络用户行为的概念及分类13
  • 2.2 校园网概况13-14
  • 2.3 数据挖掘技术分析14-17
  • 2.3.1 数据挖掘的过程15
  • 2.3.2 数据挖掘的主要方法15-17
  • 2.3.3 数据挖掘的常用工具17
  • 2.4 分析工作概述17-18
  • 2.4.1 分析的基本目标17-18
  • 2.4.2 分析的步骤18
  • 2.5 数据的采集18-21
  • 2.5.1 数据来源18-20
  • 2.5.2 数据抽取20-21
  • 2.6 数据预处理21-24
  • 2.6.1 数据清理21-22
  • 2.6.2 数据集成22
  • 2.6.3 数据变换22-24
  • 2.7 本章小结24-25
  • 第三章 关联规则算法的研究及改进25-48
  • 3.1 关联规则Apriori算法25-33
  • 3.1.1 Apriori算法的原理25-26
  • 3.1.2 Apriori算法的描述26-28
  • 3.1.3 关联规则的生成28-29
  • 3.1.4 Apriori算法实例29-32
  • 3.1.5 Apriori算法的缺点32-33
  • 3.2 负关联规则算法33-36
  • 3.2.1 负关联规则的提出33-34
  • 3.2.2 负关联规则的基本定义34-36
  • 3.3 基于Apriori算法的负关联规则算法36-39
  • 3.3.1 算法描述36-38
  • 3.3.2 算法验证实验38-39
  • 3.4 改进的Apriori算法39-47
  • 3.4.1 改进算法的思路39-40
  • 3.4.2 算法的描述40-42
  • 3.4.3 实例分析42-44
  • 3.4.4 实验结果分析44-47
  • 3.5 本章小结47-48
  • 第四章 数据挖掘在校园网用户上网日志分析的应用48-71
  • 4.1 用户上网日志应用类型统计48-50
  • 4.2 Weka平台介绍50-55
  • 4.2.1 Weka平台的特点50-53
  • 4.2.2 数据挖掘流程53-55
  • 4.3 分时段在线人数分析55-58
  • 4.3.1 实验分析55-57
  • 4.3.2 结论57-58
  • 4.4 用户访问网站分析58-63
  • 4.4.1 数据转换58
  • 4.4.2 建立模型58-62
  • 4.4.3 关联规则产生62-63
  • 4.5 不同类别用户上网日志的行为分析63-70
  • 4.5.1 数据处理63-64
  • 4.5.2 文科类用户上网日志分析64-66
  • 4.5.3 理科类用户上网日志分析66-68
  • 4.5.4 工科类用户上网日志分析68-70
  • 4.6 本章小结70-71
  • 第五章 总结与展望71-73
  • 5.1 本文的主要工作总结71-72
  • 5.2 未来工作展望72-73
  • 致谢73-74
  • 参考文献74-77
  • 图版77-79
  • 附录79-80

  本文关键词:基于用户上网日志的数据挖掘技术研究,由笔耕文化传播整理发布。



本文编号:299159

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/299159.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e7ff6***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com