基于协同过滤的电子商务推荐算法研究
发布时间:2017-08-20 18:31
本文关键词:基于协同过滤的电子商务推荐算法研究
【摘要】:电子商务产业发展迅猛,网络消费群体不断扩大,网络商品推荐技术应运而生。由此而产生的个性化推荐系统不仅能够快速地发现用户兴趣并做出推荐,还能发现用户潜在兴趣,提高电子商务网站的销售量。协同过滤算法(collaborativefiltering)是目前应用最广泛最成功的推荐技术之一,但该算法有着明显的缺陷:随着电子商务系统规模的进一步扩大,用户数目和项目数据急剧增加,严重依赖用户打分矩阵的协同过滤算法会因为用户评分数据的极端稀疏性而无法正常工作,在这种情况下,传统的算法得出的最近邻居不准确,推荐系统的推荐质量急剧下降。 针对现行的电子商务推荐算法的特点,本文认为主要原因在于过于依赖用户对项目打分矩阵。基于此,本文提出在用户打分部分采用基于统计模型的协同过滤算法来解决矩阵的稀疏性;同时,利用用户对项目的文字评论,提取情感特征值,单独形成推荐,以克服对打分矩阵的依赖性。具体工作如下: 在处理用户评分矩阵的极端,为了解决用户评分数据稀疏性和最近邻寻找的准确性问题,本文提出一种基于统计模型的协同过滤推荐算法。该算法首先利用项目统计信息分类,在类内寻找项目的最近邻居;然后通过预测项目评分值进行矩阵填充,解决稀疏性问题;最后通过用户之间的协同过滤进行推荐。实验结果表明,该算法可以准确地获取项目及用户最近邻,有效地解决数据稀疏性问题,同时,该算法还极大地提高了系统的工作效率及推荐的准确性。 鉴于用户评论中的情感态度和偏好程度可以很好地表达用户在情感方面的倾向,本文通过建立用户评论情感倾向语料库,提取以往用户评论中的语料词并根据模糊算法形成分值,利用云模型形成一个用户评论情感倾向向量,通过云模型向量间的相似度计算形成最近邻居从而形成推荐。通过实验可以得出,在传统评分矩阵中项目评分稀疏时,仍然能够通过用户对项目的情感倾向对比进行推荐,并可以以数据的形式对用户情感倾向进行统计。
【关键词】:统计模型 最近邻 协同过滤 稀疏性 云模型
【学位授予单位】:山东师范大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP391.3
【目录】:
- 摘要7-8
- ABSTRACT8-10
- 第1章 绪论10-18
- 1.1 研究背景10-11
- 1.2 研究意义11
- 1.3 研究现状11-15
- 1.3.1 协同过滤算法及稀疏矩阵问题的研究现状及趋势11-14
- 1.3.2 用户评论中的情感分析研究现状14-15
- 1.4 研究内容15-16
- 1.4.1 电子商务推荐算法需要解决的主要问题15
- 1.4.2 本文的主要工作15-16
- 1.5 论文的组织结构16-18
- 第2章 电子商务推荐系统概述18-32
- 2.1 基于内容的推荐系统20-22
- 2.2 基于协同过滤的推荐系统22-26
- 2.2.1 相似度计算方法23-24
- 2.2.2 项目分数预测公式24-25
- 2.2.3 协同过滤算法的优缺点25-26
- 2.3 基于用户的协同过滤算法26-27
- 2.4 基于项目的协同过滤算法27-29
- 2.4.1 生成项目最近邻28
- 2.4.2 进行推荐28-29
- 2.5 基于模型的推荐系统29-32
- 2.5.1 基于聚类算法的模型29-30
- 2.5.2 网状贝叶斯模型30
- 2.5.3 基于关联规则的模型30-32
- 第3章 基于统计模型的协同过滤算法32-40
- 3.1 基于统计模型的项目分类32-35
- 3.1.1 向域32-33
- 3.1.2 项目分类33-35
- 3.2 项目分数预测35
- 3.3 项目推荐35-37
- 3.3.1 对稀疏矩阵进行填充35-36
- 3.3.2 产生推荐36-37
- 3.4 实验及分析37-40
- 3.4.1 实验数据集37
- 3.4.2 测试方法37-38
- 3.4.3 测试标准38
- 3.4.4 实验结果及分析38-40
- 第4章 基于云模型的情感倾向对比推荐算法40-54
- 4.1 云模型40-43
- 4.1.1 云的定义41-42
- 4.1.2 云的发生42-43
- 4.2 用户评论的情感语料库43-44
- 4.3 推荐过程44-49
- 4.3.1 用户评论情感计算45-46
- 4.3.2 用户情感倾向矩阵表示46
- 4.3.3 基于云模型的用户情感向量46-47
- 4.3.4 相似度计算47-48
- 4.3.5 商品推荐48-49
- 4.4 实验及分析49-54
- 4.4.1 词频统计49-50
- 4.4.2 用户情感处理50-52
- 4.4.3 情感预测实验52-54
- 第5章 总结与展望54-56
- 5.1 总结54-55
- 5.2 未来研究展望55-56
- 参考文献56-60
- 致谢60-61
- 攻读硕士学位期间发表论文61
【参考文献】
中国期刊全文数据库 前10条
1 李德毅,刘常昱;论正态云模型的普适性[J];中国工程科学;2004年08期
2 张仰森,徐波,曹元大;自然语言处理中的语言模型及其比较研究[J];广西师范大学学报(自然科学版);2003年01期
3 张锋;常会友;;使用BP神经网络缓解协同过滤推荐算法的稀疏性问题[J];计算机研究与发展;2006年04期
4 顾晔;吕红兵;;改进的增量奇异值分解协同过滤算法[J];计算机工程与应用;2011年11期
5 何光辉;魏曙光;王蔚韬;;改进的聚类邻居协同过滤推荐算法[J];计算机科学;2004年11期
6 曾艳,麦永浩;基于内容预测和项目评分的协同过滤推荐[J];计算机应用;2004年01期
7 张海燕,丁峰,姜丽红;基于模糊聚类的协同过滤推荐方法[J];计算机仿真;2005年08期
8 李德毅,刘常昱,杜瀊,韩旭;不确定性人工智能[J];软件学报;2004年11期
9 许海玲;吴潇;李晓东;阎保平;;互联网推荐系统比较研究[J];软件学报;2009年02期
10 余力,刘鲁,罗掌华;我国电子商务推荐策略的比较分析[J];系统工程理论与实践;2004年08期
,本文编号:708243
本文链接:https://www.wllwen.com/jingjilunwen/dianzishangwulunwen/708243.html