当前位置:主页 > 科技论文 > 软件论文 >

基于Storm的实时推荐系统研究与设计

发布时间:2018-10-20 06:44
【摘要】:伴随着移动互联网,电子商务以及物联网的爆发式发展,产生了海量的数据,产生了信息超载(information overload)问题。当前,此类问题的解决方法之一是使用推荐系统。传统的推荐系统大多基于非实时的Hadoop处理框架,以“批”方式进行处理,无法满足数据的实时处理要求。而Storm对数据以“流”方式进行处理,基于内存进行运算,可以保证数据信息被快速处理,且实时更新并写入数据库。本文基于实时的、分布式的流数据处理框架Storm进行推荐系统相关研究,进行了以下工作:第一:对Storm框架进行学习。了解消息可靠处理机制(ACK);掌握了核心组件Spout、Bolt的功能以及实现方法;能够设计Topology结构,基于Storm Trident的高级抽象进行开发。第二:基于Storm的推荐系统常规采用基于SVD的k-means协同过滤算法。SVD先将评分矩阵中的缺失值补全,然后将其分解成3个低阶矩阵,最后用计算得到的用户预测评分来更新评分矩阵的缺失项,在矩阵项达到数百万的情况下,上述过程时间消耗代价巨大。为了进一步提升计算效率,本文提出了基于改进SVD的k-means协同过滤算法,改进SVD引入损失函数的概念,建立均方差最小化函数,通过梯度下降法迭代对其进行优化求解,简化了矩阵分解运算。在MovieLens-10m数据集上进行实验,与传统SVD算法相比,本文提出算法在推荐时间效率方面得到了提升。第三:实现了基于Storm的实时推荐系统,首先,增加了Flume日志采集过滤子系统,该系统用于接收多种类型的用户消息数据并进行过滤;其次,设计了Kafka数据缓冲队列模块,防止数据丢失,确保系统可靠;最后,对Storm集群进行部署,设计了算法拓扑逻辑结构,经过测试已达到设计要求,并实际上线成功应用于电影推荐中。
[Abstract]:With the explosive development of mobile internet, electronic commerce and Internet of things, massive data and information overload (information overload) are produced. Currently, one of the solutions to such problems is to use recommendation systems. Most of the traditional recommendation systems are based on the non-real-time Hadoop processing framework, which can not meet the requirements of real-time data processing because of the "batch" processing. Storm processes the data in a "stream" mode and computes the data based on memory, which ensures that the data information can be processed quickly, and the data can be updated and written to the database in real time. In this paper, based on the real-time, distributed streaming data processing framework (Storm), the recommendation system is studied. The following work is done: first, the Storm framework is studied. (ACK); has grasped the function and the implementation method of the core component Spout,Bolt, and can design the Topology structure and develop it based on the advanced abstraction of Storm Trident. Second, the recommendation system based on Storm adopts k-means collaborative filtering algorithm based on SVD. SVD first complements the missing value in the score matrix and then decomposes it into three low-order matrices. Finally, the missing items of the scoring matrix are updated with the calculated user prediction scores. When the matrix items reach millions, the cost of the process time is enormous. In order to further improve the computational efficiency, this paper proposes a k-means collaborative filtering algorithm based on improved SVD. The concept of loss function is introduced into the improved SVD, and the mean-variance minimization function is established. The matrix decomposition operation is simplified. Compared with the traditional SVD algorithm, the proposed algorithm is more efficient in recommending time than the traditional SVD algorithm. Third, a real-time recommendation system based on Storm is implemented. Firstly, the Flume log collection and filtering subsystem is added, which is used to receive and filter various types of user message data. Secondly, the Kafka data buffer queue module is designed. Finally, the Storm cluster is deployed and the algorithm topology logic structure is designed. The algorithm has been tested to meet the design requirements, and in fact, the line has been successfully applied in the movie recommendation.
【学位授予单位】:中北大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.3

【相似文献】

相关期刊论文 前10条

1 米可菲;张勇;邢春晓;蔚欣;;面向大数据的开源推荐系统分析[J];计算机与数字工程;2013年10期

2 脱建勇;王嵩;李秀;刘文煌;;精品课共享中的推荐系统框架与实现[J];计算机工程与设计;2006年17期

3 苏冠贤;张丽霞;林丕源;刘吉平;;生物信息学推荐系统的设计与实现[J];计算机应用研究;2007年05期

4 王改芬;;推荐系统研究综述[J];软件导刊;2007年23期

5 叶群来;;营销与网络推荐系统[J];电子商务;2007年10期

6 李媚;;个性化网络学习资源推荐系统研究[J];福建电脑;2008年12期

7 潘冉;姜丽红;;基于经济学模型的推荐系统的研究[J];计算机应用与软件;2008年03期

8 刘鲁;任晓丽;;推荐系统研究进展及展望[J];信息系统学报;2008年01期

9 刘小燕;陈艳丽;贾宗璞;沈记全;;基于增强学习的旅行计划推荐系统[J];计算机工程;2010年21期

10 曹畋;;智能推荐系统在知识浏览领域的应用[J];硅谷;2011年21期

相关会议论文 前8条

1 张燕;李燕萍;;基于内容分析和点击率记录的混合音乐推荐系统[A];2009年通信理论与信号处理学术年会论文集[C];2009年

2 赵欣;寇纲;邬文帅;卢艳群;;基于时间密集性的推荐系统攻击检测[A];第六届(2011)中国管理学年会论文摘要集[C];2011年

3 张玉连;张波;张敏;;改进的个性化信息推荐系统的设计与实现[A];2005年全国理论计算机科学学术年会论文集[C];2005年

4 王君;许洁萍;;层次音乐推荐系统的研究[A];第18届全国多媒体学术会议(NCMT2009)、第5届全国人机交互学术会议(CHCI2009)、第5届全国普适计算学术会议(PCC2009)论文集[C];2009年

5 潘宇;林鸿飞;杨志豪;;基于用户聚类的电子商务推荐系统[A];第三届学生计算语言学研讨会论文集[C];2006年

6 尤忠彬;陈越;张英;朱扬勇;;基于Web服务的技术转移平台推荐系统研究[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年

7 王国霞;刘贺平;李擎;;二部图影射及其在推荐系统中的应用[A];第25届中国控制与决策会议论文集[C];2013年

8 王雪;董爱华;吴怡之;;基于RFID技术的智能服装推荐系统设计[A];2011年全国电子信息技术与应用学术会议论文集[C];2011年

相关重要报纸文章 前2条

1 ;大数据如何“落地”[N];中国新闻出版报;2014年

2 本报记者 邹大斌;大数据:电商新武器[N];计算机世界;2012年

相关博士学位论文 前10条

1 周魏;推荐系统中基于目标项目分析的托攻击检测研究[D];重庆大学;2015年

2 田刚;融合维基知识的情境感知Web服务发现方法研究[D];武汉大学;2015年

3 胡亮;集成多元信息的推荐系统建模方法的研究[D];上海交通大学;2015年

4 孙丽梅;Web-based推荐系统中若干关键问题研究[D];东北大学;2013年

5 郑麟;基于属性提升与偏好集成的上下文感知推荐[D];武汉大学;2017年

6 王宏宇;商务推荐系统的设计研究[D];中国科学技术大学;2007年

7 杨东辉;基于情感相似度的社会化推荐系统研究[D];哈尔滨工业大学;2014年

8 曹渝昆;基于神经网络和模糊逻辑的智能推荐系统研究[D];重庆大学;2006年

9 王立才;上下文感知推荐系统若干关键技术研究[D];北京邮电大学;2012年

10 刘龙;一个能实现个性化实时路径推荐服务的推荐系统框架[D];中国科学技术大学;2014年

相关硕士学位论文 前10条

1 朱孔真;基于云计算的电子商务智能推荐系统研究[D];武汉理工大学;2014年

2 郭敬泽;基于赋权评分和Dpark的分布式推荐系统研究与实现[D];天津理工大学;2015年

3 周俊宇;信息推荐系统的研究与设计[D];江南大学;2015年

4 李炜;基于电子商务平台的保险推荐系统的设计与实现[D];复旦大学;2013年

5 车丰;基于排序主题模型的论文推荐系统[D];大连海事大学;2015年

6 秦大路;基于因式分解机模型的上下文感知推荐系统研究[D];郑州大学;2015年

7 徐霞婷;动态路网监控与导航推荐系统的设计与实现[D];苏州大学;2015年

8 黄学峰;基于Hadoop的电影推荐系统研究与实现[D];南京师范大学;2015年

9 路小瑞;基于Hadoop平台的职位推荐系统的设计与实现[D];上海交通大学;2015年

10 李爱宝;基于组合消费行为分析的团购推荐系统的设计与实现[D];哈尔滨工业大学;2015年



本文编号:2282347

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2282347.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户22d09***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com