基于用户上网日志的数据挖掘技术研究
发布时间:2017-04-11 13:09
本文关键词:基于用户上网日志的数据挖掘技术研究,,由笔耕文化传播整理发布。
【摘要】:伴随着数据挖掘的技术的成熟发展,运用数据挖掘技术来对校园网进行研究具有很大的应用价值,对用户的上网日志分析是网络研究和管理的主要方向。本文研究的主要内容是利用校园网学生的上网行为数据进行分析,挖掘出用户的上网时段、用户访问网站类型等上网行为特征。旨在通过分析学生的行为日志记录的规律,掌握和预测校园网的运行状况,为校园网络建设和管理给出科学的依据。论文所做的工作具体如下:首先对系统分析工作进行概述,进行校园网中用户的上网日志数据的采集,通过数据预处理、数据转换等得到适合分析的数据属性集合,将这些数据存放在数据库中以供挖掘使用。然后对本文所采用的关联规则Apriori算法做分析与研究,分析算法的不足之处。引用负关联规则,将两种算法结合在一起,分析其可行性,并且提出自己的改进思想,改进算法只需要扫描一次数据库,大大提高了算法的运行速度,并通过实验对比验证了改进算法的有效性。最后对校园网的学生上网行为从多方面进行研究,包括分时段在线人数分析、用户访问网站分析、不同类别用户上网行为分析等。其中,在对用户访问网站分析和不同类别用户上网分析时,利用Weka数据挖掘平台进行分析,得到相关用户的上网特点。通过对学生的上网行为分析,可以对校园网的优化给出合理的建议。此研究也可以应用在商业领域上,为顾客提供个性化服务,增强企业的竞争力。
【关键词】:数据挖掘 用户上网行为 关联规则 Apriori算法
【学位授予单位】:贵州大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP311.13
【目录】:
- 摘要4-5
- Abstract5-7
- 第一章 绪论7-13
- 1.1 课题的研究背景7-8
- 1.2 课题的研究意义8-9
- 1.3 国内外的研究现状9-11
- 1.3.1 国内研究现状9-10
- 1.3.2 国外研究现状10-11
- 1.4 本文的研究内容和文章结构11-12
- 1.4.1 主要的研究内容11-12
- 1.4.2 文章结构12
- 1.4.3 论文的主要创新点12
- 1.5 本章小结12-13
- 第二章 校园网用户上网日志分析与数据挖掘13-25
- 2.1 网络用户行为的概念及分类13
- 2.2 校园网概况13-14
- 2.3 数据挖掘技术分析14-17
- 2.3.1 数据挖掘的过程15
- 2.3.2 数据挖掘的主要方法15-17
- 2.3.3 数据挖掘的常用工具17
- 2.4 分析工作概述17-18
- 2.4.1 分析的基本目标17-18
- 2.4.2 分析的步骤18
- 2.5 数据的采集18-21
- 2.5.1 数据来源18-20
- 2.5.2 数据抽取20-21
- 2.6 数据预处理21-24
- 2.6.1 数据清理21-22
- 2.6.2 数据集成22
- 2.6.3 数据变换22-24
- 2.7 本章小结24-25
- 第三章 关联规则算法的研究及改进25-48
- 3.1 关联规则Apriori算法25-33
- 3.1.1 Apriori算法的原理25-26
- 3.1.2 Apriori算法的描述26-28
- 3.1.3 关联规则的生成28-29
- 3.1.4 Apriori算法实例29-32
- 3.1.5 Apriori算法的缺点32-33
- 3.2 负关联规则算法33-36
- 3.2.1 负关联规则的提出33-34
- 3.2.2 负关联规则的基本定义34-36
- 3.3 基于Apriori算法的负关联规则算法36-39
- 3.3.1 算法描述36-38
- 3.3.2 算法验证实验38-39
- 3.4 改进的Apriori算法39-47
- 3.4.1 改进算法的思路39-40
- 3.4.2 算法的描述40-42
- 3.4.3 实例分析42-44
- 3.4.4 实验结果分析44-47
- 3.5 本章小结47-48
- 第四章 数据挖掘在校园网用户上网日志分析的应用48-71
- 4.1 用户上网日志应用类型统计48-50
- 4.2 Weka平台介绍50-55
- 4.2.1 Weka平台的特点50-53
- 4.2.2 数据挖掘流程53-55
- 4.3 分时段在线人数分析55-58
- 4.3.1 实验分析55-57
- 4.3.2 结论57-58
- 4.4 用户访问网站分析58-63
- 4.4.1 数据转换58
- 4.4.2 建立模型58-62
- 4.4.3 关联规则产生62-63
- 4.5 不同类别用户上网日志的行为分析63-70
- 4.5.1 数据处理63-64
- 4.5.2 文科类用户上网日志分析64-66
- 4.5.3 理科类用户上网日志分析66-68
- 4.5.4 工科类用户上网日志分析68-70
- 4.6 本章小结70-71
- 第五章 总结与展望71-73
- 5.1 本文的主要工作总结71-72
- 5.2 未来工作展望72-73
- 致谢73-74
- 参考文献74-77
- 图版77-79
- 附录79-80
本文关键词:基于用户上网日志的数据挖掘技术研究,由笔耕文化传播整理发布。
本文编号:299159
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/299159.html