当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于Spark的视频推荐系统研究与实现

发布时间:2020-03-19 10:04
【摘要】:随着互联网的飞速发展,数据充斥着人们日常生活的方方面面,人们已经进入了大数据时代。而数据中却蕴藏着丰富的有价值的信息,面对数据的爆炸式增长,如何运用有效的方法挖掘出数据中有价值的信息在大数据的研究课题中具有重要意义。Hadoop作为一个开源的分布式大数据处理框架,采用Hadoop Distributed File System(HDFS)进行存储和Map Reduce(MR)进行计算,但面对海量数据计算,基于MR计算已经无法满足用户日益提高的服务要求。而Spark的诞生大大改善了这一点,它是基于内存计算的分布式大数据处理框架,使用Resilient Distributed Datasets(RDD)数据模型编程,与MR相比,大大减少了磁盘的I/O次数,特别是在高迭代的数据计算中表现的尤为明显。因此,Spark一经诞生迅速受到了广大企业、学者的追捧。推荐系统是解决信息过载的有效办法,本文采用协同过滤算法基于Spark平台实现一个视频推荐系统帮助用户在海量视频数据中挖掘出真正想要的视频信息。但使用Spark平台进行数据处理过程花费的时间也很漫长,不能够满足用户的需求,而搭建分布式的Spark集群可以实现数据并行化计算,从而有效提高计算效率。本文通过对推荐算法并行化设计以及推荐系统的分析与设计,完成了基于Spark的视频推荐系统的实现。主要所做的工作如下:(1)基于Spark的视频推荐算法的并行化设计。首先通过对推荐算法和Spark平台及其各个组件的了解,详细设计了推荐算法在分布式的Spark集群中的并行化实现过程,包括基于项目的协同过滤和基于用户的协同过滤推荐算法的并行化实现。最后,通过对比实验比较了推荐算法在基于Spark集群和基于Hadoop集群上的性能差异。(2)基于Spark的视频推荐系统的实现。本文主要是基于Spark平台完成了视频推荐系统的实现,系统将获取的Web日志进行预处理存入数据库中,训练推荐模型,采用实时和离线推荐相结合的方式给用户产生推荐列表。系统将数据处理以及模型训练在Ubuntu系统上的Spark集群中进行,而将视频推荐和业务逻辑模块以及推荐列表展示在Windows系统中进行。
【图文】:

系统架构,平台,节点,主节点


搭建 Spark 集群对硬件设备要求比较高,鉴于资源有限,在这次搭建 Spark群之前,预先设计的是使用 1 个 Master 节点和 3 个 Worker 节点。待全部部署[26]功后启动整个 Spark 集群,可以看到每个节点启动的进程,具体如图 2.1 所示:1 在部署集群之前,预设的是 1 个主节点和 3 个工作节点。2 启动 Spark 集群之后,在每个节点的图形化界面输入命令 jps,在主节上有 1 个主节点守护进程,在其它工作节点上分别有 1 个工作节点守护进程。3 主节点和工作节点在集群中所担任的任务是不同的,主节点主要负责所工作节点,而工作节点主要负责执行相关任务。4 Driver 职责是转换用户程序到 task,并在在 Executor 上调度 task。5 每 个 工 作 节 点 包 含 一 个 Worker 守 护 进 程 , Worker 又 包 含 多 个cutorRunner 对象,ExcutorRunner 对象又包含 ExcutorBackend 进程,每个cutorBackend 拥有一个 Executor 对象,Executor 包含一个或者多个 task,当要工作节点执行任务时,就是 task 在工作。

计算规则,实际执行,输入数据


RDD 自身的 Lineage 机制,会将 RDD 之间的变换进行记录。比如,它会记录父代RDD 是经过了怎样的转换或者动作,才由父代 RDD 得到该 RDD 的信息,所以 Spark具备的容错特性比较优良。2.2.2 Spark 的核心Spark 的核心是 RDD,即弹性分布式数据集,它是 Spark 的编程模型,这种新型数据集的由来非常广泛,既可以通过外部存储系统导入,也可以通过其他 RDD运算而来。在 RDD 之上,可以进行三种类型的运算:分别是 Transformation(转换),Action(动作),Persistence(持久化),Transformation 操作包括 map、flatMap、reduceByKey 等函数,这些操作运算的结果会产生另外一个 RDD,但是不会立即执行,,它会等到执行 Action 运算时,才会实际执行;Action 操作包括reduce、collect、first 等函数,这些操作运行的结果不会产生另外一个 RDD,但是会立即执行,并且连同之前的“转换”操作一起执行;RDD 在内存中进行计算时会经常使用同一个数据集,那么利用 RDD 的持久化技术可以实现数据的重复利用,以此来提高任务执行的性能。下面将以图 2.2 说明:
【学位授予单位】:重庆师范大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP391.3

【相似文献】

相关期刊论文 前10条

1 刘天啸;;大数据背景下新闻推荐系统中的问题以及解决对策[J];科技传播;2019年13期

2 刘强;;推荐系统的商业价值[J];软件和集成电路;2019年04期

3 王月星;;国内旅游推荐系统研究进展[J];商场现代化;2017年10期

4 常亮;曹玉婷;孙文平;张伟涛;陈君同;;旅游推荐系统研究综述[J];计算机科学;2017年10期

5 王毅;;网络推荐系统的三大挑战——从用户体验出发[J];清华管理评论;2013年06期

6 王海明;;基于大数据下电子商务商品推荐系统的分析[J];环球市场信息导报;2017年27期

7 ;电商推荐系统进阶[J];IT经理世界;2013年11期

8 王霞;;电子商务推荐系统评述[J];福建电脑;2006年08期

9 傅孟如;姜素兰;闵娅萍;;VAX—11/750机学生测评、推荐系统的设计与应用[J];计算技术与自动化;1989年03期

10 张佳威;;美团推荐系统实证系统[J];农家参谋;2018年11期

相关会议论文 前10条

1 张燕;李燕萍;;基于内容分析和点击率记录的混合音乐推荐系统[A];2009年通信理论与信号处理学术年会论文集[C];2009年

2 高梦晨;;推荐系统用户感知调研[A];工业设计研究(第六辑)[C];2018年

3 李成;胡文丽;;推荐系统体验模型探索——以视频推荐为例[A];工业设计研究(第六辑)[C];2018年

4 李成;冯青青;;推荐系统准确度衡量方案——引入权重概念[A];工业设计研究(第五辑)[C];2017年

5 王晓光;施玉海;尹亚光;;面向广电的节目推荐系统研究[A];中国新闻技术工作者联合会2017年学术年会论文集(学术论文篇)[C];2017年

6 周小田;王宏志;郭翔宇;胡筱;董志鑫;李建中;高宏;;基于知识库的互联网商品信息分类与推荐系统[A];第29届中国数据库学术会议论文集(B辑)(NDBC2012)[C];2012年

7 汤娟梅;唐岭;;个性化英语阅读文章推荐系统的设计[A];计算机与教育:理论、实践与创新——全国计算机辅助教育学会第十四届学术年会论文集[C];2010年

8 王雪;董爱华;吴怡之;;基于RFID技术的智能服装推荐系统设计[A];2011年全国电子信息技术与应用学术会议论文集[C];2011年

9 张玉连;张波;张敏;;改进的个性化信息推荐系统的设计与实现[A];2005年全国理论计算机科学学术年会论文集[C];2005年

10 王君;许洁萍;;层次音乐推荐系统的研究[A];第18届全国多媒体学术会议(NCMT2009)、第5届全国人机交互学术会议(CHCI2009)、第5届全国普适计算学术会议(PCC2009)论文集[C];2009年

相关重要报纸文章 前5条

1 记者 周源;知意图发布推荐系统Etu Recommender[N];网络世界;2012年

2 本报记者 邹大斌;大数据:电商新武器[N];计算机世界;2012年

3 本报记者 冯卫东;网络导购:找出你的最爱[N];科技日报;2007年

4 本报记者 邱燕娜;精准推荐 一客一市场[N];中国计算机报;2012年

5 张秋明;用数据是新技能[N];福州日报;2015年

相关博士学位论文 前10条

1 王梦晗;推荐系统中数据缺失问题的研究[D];浙江大学;2019年

2 张亮;网络推荐系统中基于时间信息的新颖性研究[D];厦门大学;2017年

3 夏彬;基于位置信息社交网络的推荐系统研究[D];南京理工大学;2018年

4 蒋伟;推荐系统若干关键技术研究[D];电子科技大学;2018年

5 练建勋;基于多样化内容数据的个性化推荐系统[D];中国科学技术大学;2018年

6 曹渝昆;基于神经网络和模糊逻辑的智能推荐系统研究[D];重庆大学;2006年

7 王宏宇;商务推荐系统的设计研究[D];中国科学技术大学;2007年

8 颜端武;面向知识服务的智能推荐系统研究[D];南京理工大学;2007年

9 刘龙;一个能实现个性化实时路径推荐服务的推荐系统框架[D];中国科学技术大学;2014年

10 杨东辉;基于情感相似度的社会化推荐系统研究[D];哈尔滨工业大学;2014年

相关硕士学位论文 前10条

1 于洋;商品推荐系统中冷启动问题的研究及实现[D];天津理工大学;2019年

2 何q谀

本文编号:2590080


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2590080.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户f84ab***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com