电子商务系统中Web数据挖掘技术的研究与实现
本文关键词:电子商务系统中Web数据挖掘技术的研究与实现,由笔耕文化传播整理发布。
【摘要】:随着Internet的兴起和普及,电子商务因为其成本低,方便快捷,足不出户就可购买商品等优点已经在全球得到普及和发展,并成为未来发展的趋势。然而,随着电子商务系统规模的扩大,大量的Web页面提供给用户越来越多的选择,它的发展面临了两大问题:一是用户面临众多的商品并不是全都感兴趣,会迷失在复杂的网络信息空间中,无法迅速有效地寻找到满意的商品;二是商家也不能了解用户的需求,提供给用户千篇一律的界面,不能够保证客户的忠诚度。因此,个性化地服务是制约电子商务系统发展的关键。 Web数据挖掘技术(Web Data Mining)就是在这一需求下运用在了电子商务系统中。Web数据挖掘,是数据挖掘技术在Web领域的延伸与发展,是从大量的Web文档集合和在站点内进行浏览的相关数据中发现潜在的,有用的模式或信息,帮助在线用户从海量的数据空间中高效地获取有价值的知识。Web数据挖掘与电子商务系统结合可以为用户提供个性化地服务。本文的主要工作如下: 1.分析了传统的协同过滤推荐算法的不足,针对原始用户-项目评分矩阵的稀疏性,提出了基于项目属性的混合协同过滤推荐算法。算法改进了传统的项目相似度算法,增加了基于项目属性的相似度计算,然后再根据新的项目相似度,预测用户对未知项目的评分,填充了原始用户-项目评分矩阵,再计算用户相似度,通过最近邻产生TopN项目推荐。最后通过实验证明了新算法使预测精度明显提高。新算法缓解了原始矩阵的稀疏性,又保留了传统协同过滤推荐算法的优势。 2.分析了Web日志频繁路径挖掘的经典算法Apriori算法和WAP算法,指出了各自的缺陷,提出了基于WAP-Tree的连续频繁遍历路径算法。算法与WAP算法相比,适合挖掘连续频繁访问路径,挖掘过程中不会生成大量中间数据,受支持度的影响很小,最后从理论和实验上证明了算法性能的优越性。 3.运用提出的基于项目属性的混合协同过滤推荐算法和改进的频繁遍历路径挖掘算法,设计与实现了网上书城电子商务系统,实现了商品的个性化推荐。
【关键词】:电子商务 个性化 协同推荐 Web日志挖掘
【学位授予单位】:电子科技大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TP311.13
【目录】:
- 摘要4-5
- ABSTRACT5-10
- 第一章 引言10-15
- 1.1 研究背景10-12
- 1.2 国内外的研究现状12-13
- 1.3 本文的主要研究内容13
- 1.4 本文的组织结构及创新点13-15
- 第二章 电子商务系统中数据挖掘及相关技术简介15-27
- 2.1 Web 数据挖掘15-18
- 2.1.1 Web 数据挖掘的分类15-16
- 2.1.2 Web 使用记录挖掘16-17
- 2.1.3 Web 数据挖掘在电子商务中的应用17-18
- 2.2 个性化推荐18-19
- 2.2.1 推荐系统定义18-19
- 2.2.2 推荐系统分类19
- 2.3 推荐算法19-26
- 2.3.1 协同过滤推荐算法19-24
- 2.3.2 基于内容的推荐算法24-25
- 2.3.3 基于关联规则的推荐算法25-26
- 2.4 本章小结26-27
- 第三章 基于项目属性的混合协同过滤推荐算法的研究27-42
- 3.1 传统的协同过滤推荐算法的稀疏性问题27-28
- 3.2 基于项目属性的改进的相似性度量方法28-32
- 3.2.1 传统的相似度量分析29-30
- 3.2.2 基于项目属性的相似度30-31
- 3.2.3 改进的综合相似度31-32
- 3.3 混合的协同过滤推荐算法32-37
- 3.3.1 基于项评分预测的平滑处理32-33
- 3.3.2 推荐算法描述33-37
- 3.4 实验及分析37-40
- 3.4.1 数据集37
- 3.4.2 评价指标37-38
- 3.4.3 实验结果及讨论38-40
- 3.5 本章小结40-42
- 第四章 Web 日志中频繁遍历路径挖掘的研究42-61
- 4.1 数据预处理42-48
- 4.1.1 数据清洗43-44
- 4.1.2 用户识别44-45
- 4.1.3 会话识别45-46
- 4.1.4 路径补充46
- 4.1.5 事务识别46-48
- 4.2 传统序列模式挖掘算法分析48-51
- 4.2.1 Apriori 算法48-49
- 4.2.2 WAP 算法49-51
- 4.3 基于WAP-Tree 的连续频繁遍历路径算法51-58
- 4.3.1 算法基本思想51-52
- 4.3.2 算法实现步骤52-58
- 4.4 算法性能分析58-60
- 4.4.1 理论分析58-59
- 4.4.2 实验分析59-60
- 4.5 本章小结60-61
- 第五章 网上书城电子商务系统的设计与实现61-80
- 5.1 系统架构61-63
- 5.2 系统功能需求分析63-65
- 5.2.1 用户子系统63-64
- 5.2.2 书城管理员子系统64-65
- 5.3 系统数据库设计65-66
- 5.4 用户子系统的实现66-72
- 5.4.1 用户注册/登录67-68
- 5.4.2 购物车管理68-71
- 5.4.3 订单管理71-72
- 5.5 管理员子系统的实现72-75
- 5.5.1 商品管理72-74
- 5.5.2 订单管理74
- 5.5.3 日志管理74-75
- 5.6 数据挖掘子系统的实现75-79
- 5.6.1 数据挖掘子系统的系统结构75-78
- 5.6.2 建立用户偏好模型78-79
- 5.6.3 产生推荐79
- 5.7 本章小结79-80
- 第六章 结束语80-82
- 6.1 论文总结和创新点80
- 6.2 进一步的研究工作和问题80-82
- 致谢82-83
- 参考文献83-86
【参考文献】
中国期刊全文数据库 前10条
1 韩家炜,孟小峰,王静,李盛恩;Web挖掘研究[J];计算机研究与发展;2001年04期
2 何炎祥,孔维强,向剑文,朱骁峰;WebLog访问序列模式挖掘[J];计算机工程与应用;2003年27期
3 彭玉;程小平;;基于属性相似性的Item-based协同过滤算法[J];计算机工程与应用;2007年14期
4 陈宝树,党齐民;Web数据挖掘中的数据预处理[J];计算机工程;2002年07期
5 余力,刘鲁;电子商务个性化推荐研究[J];计算机集成制造系统;2004年10期
6 王辉;高利军;王听忠;;个性化服务中基于用户聚类的协同过滤推荐[J];计算机应用;2007年05期
7 战立强,刘大昕;基于访问路径树的Web频繁访问路径挖掘算法研究[J];计算机应用研究;2005年01期
8 吴颜;沈洁;顾天竺;陈晓红;李慧;张舒;;协同过滤推荐系统中数据稀疏问题的解决[J];计算机应用研究;2007年06期
9 黄解军,万幼川;基于数据挖掘的电子商务策略[J];计算机应用与软件;2004年07期
10 潘瑞芳,朱永玲;基于JB和B/S模式OA系统的设计与实现[J];计算机应用与软件;2005年04期
中国博士学位论文全文数据库 前5条
1 邓爱林;电子商务推荐系统关键技术研究[D];复旦大学;2003年
2 孙小华;协同过滤系统的稀疏性与冷启动问题研究[D];浙江大学;2005年
3 沈斌;关联规则相关技术研究[D];浙江大学;2007年
4 郁雪;基于协同过滤技术的推荐方法研究[D];天津大学;2009年
5 陈琦;企业电子商务商业模式设计:IT资源前因与绩效结果[D];浙江大学;2010年
中国硕士学位论文全文数据库 前6条
1 裴蕾;基于Web数据挖掘的电子商务推荐系统研究[D];同济大学;2006年
2 张海玉;基于Web使用挖掘的个性化推荐系统[D];西北大学;2006年
3 唐曙光;Web日志中连续频繁访问路径挖掘算法研究[D];华中科技大学;2006年
4 王瑛彤;大型电子商务网站的数据挖掘[D];吉林大学;2008年
5 吴步祺;电子商务推荐系统中协同过滤技术的研究[D];南昌大学;2010年
6 孙大珩;互联网企业成功因素分析[D];上海交通大学;2010年
本文关键词:电子商务系统中Web数据挖掘技术的研究与实现,,由笔耕文化传播整理发布。
本文编号:510085
本文链接:https://www.wllwen.com/jingjilunwen/dianzishangwulunwen/510085.html