当前位置:主页 > 文艺论文 > 影视论文 >

个性化电影推荐系统的研究与设计

发布时间:2020-06-07 03:36
【摘要】:随着大数据时代的到来,数据量与日俱增,推荐系统也迎来了发展和挑战。比如,推荐系统暴露出重合点数比例高、冷启动、数据稀疏性等问题。本文根据协同过滤推荐算法的特点,研究协同过滤算法中的各种推荐技术。针对上述问题提出了不同的解决方案,即相似度计算公式的优化。首先,为解决重合点数比例过高的问题,对协同过滤推荐算法的相似度计算公式提出两点优化。经过优化得到两个相似度计算公式:Euclidean-CPARW和Concurrence-RW。在MovieLens100K数据集上进行测试,使用均方根误差作为评价指标,公式Euclidean-CPARW的推荐精度比其他四种相似度公式的计算结果提高1%左右;公式Concurrence-RW使用准确率作为评价标准,推荐结果的准确率比其他四种相似度公式提高3%左右。其次,为缓和冷启动问题和数据稀疏性问题,提出一种优化的混合协同过滤算法。该算法结合了电影标签信息,基于优化的混合相似度公式BAJ-DCMS,通过评分表中共同评分的数量,自适应的选取一种利于当前评分数的相似度公式。公式BAJ-DCMS在MovieLens数据集上证明了算法的效果,使用均方根误差作为评价指标,计算出的推荐精度比其他两种相似度公式提高2%左右。最终,实现一个基于Spark大数据处理平台的个性化电影推荐系统。包括Spark大数据处理和Scrapy网络爬虫,推荐引擎采用前文叙述的优化的混合相似度公式BAJ-DCMS。系统框架使用SSM框架,数据存储使用数据库MySQL和分布式存储系统HDFS,通过Web浏览器与用户进行人机交互,通过Web可以看到为用户推荐的个性化电影列表以及每一部电影海报、主页等信息。
【图文】:

对比图,推荐系统,优缺点,对比图


图 1-1 各类推荐系统优缺点对比图Netflix,IMDb,,MovieLens 等 Web 网站是一些流行的推荐系统,它们利用数据挖掘和数据分析的功能来分析与其用户和电影相关的各种因素,并根据这些因素提出建议。伴随着推荐系统的提出,推荐系统也如雨后春笋般发展,常见的几种推荐系统优缺点对比如图 1-1 所示。中国对于协同过滤算法的探索刚起步不久,目前尚没有完全成熟且有体系的推荐系统。随着计算机科学的发展以及推荐系统不断被推广,推荐系统的技术一定会取得更进一步的实质性的成果,他可以有效的应用在电商中,为用户推荐出适合他们的产品。1.3 本文的系统需求分析1.3.1 推荐引擎的需求

架构图,电影,会员,游客


电子科技大学硕士学位论文(3)浏览相似电影,浏览与观看过电影相似的电影。(4)浏览电影想详情,查看电影的详情页,如电影的介绍、演员情况、电影的其他链接等。(5)搜索电影,在搜索框输入电影名字对数据库中电影的搜索。可以按类别搜索、按热度搜索、按时间搜索、按名称搜索、按时间搜索。(6)浏览相关资讯,查看与当前电影相关的评价等。(7)浏览推荐电影,根据用户平时的电影评分和兴趣标签对用户推荐默认的10 部电影。(8)个人主页,对个人主页的信息进行更改。比如编辑个人资料、查看收藏电影、查看评价电影。(9)评价、收藏电影,对观看或未观看过的电影做出评价或评分以及收藏等操作。
【学位授予单位】:电子科技大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:J943;TP391.3

【参考文献】

相关期刊论文 前10条

1 师秦龙;陈伟;魏浩;;基于物品协同过滤推荐系统的研究[J];福建电脑;2015年07期

2 查九;李振博;徐桂琼;;基于组合相似度的优化协同过滤算法[J];计算机应用与软件;2014年12期

3 冷亚军;陆青;梁昌勇;;协同过滤推荐技术综述[J];模式识别与人工智能;2014年08期

4 荣辉桂;火生旭;胡春华;莫进侠;;基于用户相似度的协同过滤推荐算法[J];通信学报;2014年02期

5 李芬;朱志祥;刘盛辉;;大数据发展现状及面临的问题[J];西安邮电大学学报;2013年05期

6 邬贺铨;;大数据时代的机遇与挑战[J];求是;2013年04期

7 孙冬婷;何涛;张福海;;推荐系统中的冷启动问题研究综述[J];计算机与现代化;2012年05期

8 朱郁筱;吕琳媛;;推荐系统评价指标综述[J];电子科技大学学报;2012年02期

9 许棣华;王志坚;林巧民;黄卫东;;一种基于偏好的个性化标签推荐系统[J];计算机应用研究;2011年07期

10 汤效琴;;数据挖掘中的软计算方法及其应用[J];计算机系统应用;2008年03期

相关博士学位论文 前1条

1 练建勋;基于多样化内容数据的个性化推荐系统[D];中国科学技术大学;2018年

相关硕士学位论文 前6条

1 李巧巧;面向负载均衡的Spark任务划分与调度策略研究[D];湖南大学;2017年

2 武志强;基于SpringMVC和MyBatis框架的理财规划系统的设计与实现[D];北京交通大学;2016年

3 朱明;基于Hadoop2.0的海量数据处理[D];辽宁科技大学;2015年

4 李文栋;基于Spark的大数据挖掘技术的研究与实现[D];山东大学;2015年

5 胡于响;基于Spark的推荐系统的设计与实现[D];浙江大学;2015年

6 宋瑞平;混合推荐算法的研究[D];兰州大学;2014年



本文编号:2700777

资料下载
论文发表

本文链接:https://www.wllwen.com/wenyilunwen/dianyingdianshilunwen/2700777.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户92692***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com