数据挖掘技术在自适应网站中的应用研究
发布时间:2021-10-23 01:58
当前网络信息的增长速度让人瞠目结舌,海量的数据信息让每一位网络用户无所适从。针对目前这种大数据信息的网络现状,数据挖掘技术应运而生。本文提出了在网站上运用数据挖掘技术获取到网络用户的浏览模式等知识,并使用这些规则、知识有目的性的提升网站使用效率和亲和度。本文的主要内容:首先,文章阐述了数据挖掘,并对数据挖掘技术中的日志挖掘进行了介绍和分析,着重的分析和研究了数据挖掘过程中的数据预处理操作。第二,本文通过在传统的关联规则算法的基础上做了改进,主要的思路是:针对相对较低的运行效率,通过减少关联规则算法对频繁、冗余的对数据源扫描,以此提高运行效率。第三,文章研究了常用的数据挖掘算法、最大向前引用算法、会话识别以及EM聚类算法等。这些算法的运用能帮助我们跟好、更快捷的获取我们所可能关心和需要的信息内容,极大的提高了在海量的数据中提取我们需要的知识效率。第四,在上述算法和技术的基础上,本文对自适应网站进行深入研究,将数据挖掘技术和自适应网站系统结合起来,尝试制作了自适应网站系统的基本框架结构。同时针对自适应网站系统的存在的一般性不足,给出了一些改进意见和建议。第五,本文提出了Cookies技术和...
【文章来源】:浙江工业大学浙江省
【文章页数】:65 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 研究背景和现状
1.1.1 数据挖掘的发展现状
1.1.2 自适应站点的发展现状
1.2 论文主要工作
1.3 论文的组织结构
1.4 本章小结
第2章 数据挖掘技术
2.1 Internet技术
2.2 数据挖掘
2.2.1 数据挖掘分类
2.2.2 数据挖掘基本流程
2.3 数据挖掘的商业应用
2.4 本章小结
第3章 日志信息挖掘分析与研究
3.1 日志挖掘
3.1.1 日志数据分析
3.1.2 日志数据挖掘过程
3.2 日志挖掘的预处理过程分析
3.2.1 日志数据清洗
3.2.2 用户身份和会话识别
3.2.3 访问路径填充
3.3 日志挖掘算法
3.3.1 序列模式挖掘算法
3.3.2 聚类算法
3.3.3 Apriori算法改进
3.4 本章小结
第4章 自适应网站系统
4.1 自适应网站
4.1.1 工作原理
4.1.2 自适应网站框架
4.2 自适应网站设计原则
4.3 本章小结
第5章 基于日志挖掘的自适应网站实现
5.1 收集日志数据
5.2 日志数据处理
5.2.1 数据优化
5.2.2 用户身份识别
5.3 添加链接
5.4 算法实验和结果分析
5.4.1 Apriori算法实验分析
5.4.2 EM算法实验分析
5.5 测试环境和结果分析
5.6 本章小结
第6章 论文总结与展望
6.1 总结
6.2 展望
参考文献
致谢
攻读学位期间的研究成果
本文编号:3452251
【文章来源】:浙江工业大学浙江省
【文章页数】:65 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 研究背景和现状
1.1.1 数据挖掘的发展现状
1.1.2 自适应站点的发展现状
1.2 论文主要工作
1.3 论文的组织结构
1.4 本章小结
第2章 数据挖掘技术
2.1 Internet技术
2.2 数据挖掘
2.2.1 数据挖掘分类
2.2.2 数据挖掘基本流程
2.3 数据挖掘的商业应用
2.4 本章小结
第3章 日志信息挖掘分析与研究
3.1 日志挖掘
3.1.1 日志数据分析
3.1.2 日志数据挖掘过程
3.2 日志挖掘的预处理过程分析
3.2.1 日志数据清洗
3.2.2 用户身份和会话识别
3.2.3 访问路径填充
3.3 日志挖掘算法
3.3.1 序列模式挖掘算法
3.3.2 聚类算法
3.3.3 Apriori算法改进
3.4 本章小结
第4章 自适应网站系统
4.1 自适应网站
4.1.1 工作原理
4.1.2 自适应网站框架
4.2 自适应网站设计原则
4.3 本章小结
第5章 基于日志挖掘的自适应网站实现
5.1 收集日志数据
5.2 日志数据处理
5.2.1 数据优化
5.2.2 用户身份识别
5.3 添加链接
5.4 算法实验和结果分析
5.4.1 Apriori算法实验分析
5.4.2 EM算法实验分析
5.5 测试环境和结果分析
5.6 本章小结
第6章 论文总结与展望
6.1 总结
6.2 展望
参考文献
致谢
攻读学位期间的研究成果
本文编号:3452251
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3452251.html