基于Hadoop的新闻推荐系统关键技术的研究
本文关键词: 推荐系统 大数据 聚类算法 推荐算法 出处:《天津理工大学》2017年硕士论文 论文类型:学位论文
【摘要】:近年来,互联网技术的迅猛发展对用户造成了信息过载的困扰,导致用户想要获取需要的信息变得愈发困难。搜索引擎虽然能够给用户查询想要的信息,但是仍然缺乏主动性。在这个基础上,出现了个性化推荐系统。个性化推荐系统不需要用户输入信息,便能主动提供用户感兴趣的信息,因此得到了广泛使用。个性化推荐系统通常建立在大数据量分析与挖掘平台上,通过对用户的注册登录信息,历史行为等来分析用户的偏好,找到用户潜在的兴趣,进而进行个性化推荐来改善用户的互联网体验。在新闻媒体领域,每天都会产生海量的数据。新闻数据往往具有鲜明的时效性,归类性,社会化等特点。针对这些特点,已经有一些新兴的新闻媒体将传统的新闻推送方式与个性化推荐系统相结合,极大的增强了用户与新闻介质之间的黏性,也使得新闻媒体更好的融入到互联网的发展中。虽然新闻媒体与个性化推荐系统的结合是主流趋势,但仍然会面临一些推荐系统特有的问题,如冷启动,数据量太大,准确率与召回率过低,时效性等等,这些问题的解决都是研究个性化推荐系统中的关键。本文结合了目前推荐系统中的研究成果,将社交化的用户信息结合到个性化新闻推荐系统中,本文的主要工作成果为:1、将用户的社交信息与用户历史行为捆绑推荐。2、为提高推荐系统效率,提出了一种基于社交网络的最短距离聚类算法(SDCA),力求在推荐算法执行之前,预先对用户进行一次聚类。此算法改变传统的推荐系统的输入方式,使得推荐系统的推荐效率得到了有效提高。3、将个性化新闻推荐系统与大数据相结合,使得此推荐系统能够并行运行,提高了可扩展性,适应了目前海量新闻报道的需求。4、对数据规模与相关参数进行了实验,实现了一个个性化新闻推荐系统,并对准确度,实时性等进行了相关测试。本文首先阐述了当前个性化推荐系统的研究现状,总结了当前主流的推荐算法与推荐系统搭建运行过程中常遇到的问题及解决方案,然后提出了一种基于社交网络的聚类算法,最后给出了基于Hadoop平台实现的新闻推荐系统。
[Abstract]:In recent years, with the rapid development of Internet technology, users are troubled by information overload, which makes it more and more difficult for users to obtain the information they need. However, there is still a lack of initiative. On this basis, personalized recommendation systems have emerged. Personalized recommendation systems can actively provide information of interest to users without requiring users to input information. So it is widely used. Personalized recommendation system is usually built on the platform of large amount of data analysis and mining, through the registration of users login information, historical behavior to analyze the preferences of users, to find out the potential interests of users, In the field of news media, a huge amount of data is produced every day. News data often have distinct characteristics such as timeliness, categorization, socialization and so on. Some new news media have combined the traditional news push mode with the personalized recommendation system, which has greatly enhanced the viscosity between users and news media. It also makes the news media better integrate into the development of the Internet. Although the combination of news media and personalized recommendation system is the mainstream trend, it still faces some unique problems of the recommendation system, such as cold start, too large amount of data. The accuracy rate and recall rate are too low, timeliness and so on. The solution of these problems is the key to the study of personalized recommendation system. In order to improve the efficiency of the recommendation system, the main work result of this paper is: 1, which binds the social information of the user with the historical behavior of the user, and binds the social information of the user to the personalized news recommendation system, so as to improve the efficiency of the recommendation system. In this paper, a shortest distance clustering algorithm based on social network (SNS) is proposed, which tries to cluster users once before the recommendation algorithm is implemented. This algorithm changes the input mode of traditional recommendation system. The recommendation efficiency of the recommendation system is improved effectively. 3. The personalized news recommendation system is combined with big data to make the recommendation system run in parallel and improve the scalability. According to the demand of mass news report. 4, the data scale and related parameters are experimented, a personalized news recommendation system is realized, and the accuracy is analyzed. First of all, this paper describes the current research status of personalized recommendation system, summarizes the current mainstream recommendation algorithm and recommendation system in the process of building and running problems and solutions, Then a clustering algorithm based on social network is proposed, and a news recommendation system based on Hadoop platform is given.
【学位授予单位】:天津理工大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.3
【相似文献】
相关期刊论文 前10条
1 米可菲;张勇;邢春晓;蔚欣;;面向大数据的开源推荐系统分析[J];计算机与数字工程;2013年10期
2 脱建勇;王嵩;李秀;刘文煌;;精品课共享中的推荐系统框架与实现[J];计算机工程与设计;2006年17期
3 苏冠贤;张丽霞;林丕源;刘吉平;;生物信息学推荐系统的设计与实现[J];计算机应用研究;2007年05期
4 王改芬;;推荐系统研究综述[J];软件导刊;2007年23期
5 叶群来;;营销与网络推荐系统[J];电子商务;2007年10期
6 李媚;;个性化网络学习资源推荐系统研究[J];福建电脑;2008年12期
7 潘冉;姜丽红;;基于经济学模型的推荐系统的研究[J];计算机应用与软件;2008年03期
8 刘鲁;任晓丽;;推荐系统研究进展及展望[J];信息系统学报;2008年01期
9 刘小燕;陈艳丽;贾宗璞;沈记全;;基于增强学习的旅行计划推荐系统[J];计算机工程;2010年21期
10 曹畋;;智能推荐系统在知识浏览领域的应用[J];硅谷;2011年21期
相关会议论文 前8条
1 张燕;李燕萍;;基于内容分析和点击率记录的混合音乐推荐系统[A];2009年通信理论与信号处理学术年会论文集[C];2009年
2 赵欣;寇纲;邬文帅;卢艳群;;基于时间密集性的推荐系统攻击检测[A];第六届(2011)中国管理学年会论文摘要集[C];2011年
3 张玉连;张波;张敏;;改进的个性化信息推荐系统的设计与实现[A];2005年全国理论计算机科学学术年会论文集[C];2005年
4 王君;许洁萍;;层次音乐推荐系统的研究[A];第18届全国多媒体学术会议(NCMT2009)、第5届全国人机交互学术会议(CHCI2009)、第5届全国普适计算学术会议(PCC2009)论文集[C];2009年
5 潘宇;林鸿飞;杨志豪;;基于用户聚类的电子商务推荐系统[A];第三届学生计算语言学研讨会论文集[C];2006年
6 尤忠彬;陈越;张英;朱扬勇;;基于Web服务的技术转移平台推荐系统研究[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
7 王国霞;刘贺平;李擎;;二部图影射及其在推荐系统中的应用[A];第25届中国控制与决策会议论文集[C];2013年
8 王雪;董爱华;吴怡之;;基于RFID技术的智能服装推荐系统设计[A];2011年全国电子信息技术与应用学术会议论文集[C];2011年
相关重要报纸文章 前2条
1 ;大数据如何“落地”[N];中国新闻出版报;2014年
2 本报记者 邹大斌;大数据:电商新武器[N];计算机世界;2012年
相关博士学位论文 前10条
1 周魏;推荐系统中基于目标项目分析的托攻击检测研究[D];重庆大学;2015年
2 田刚;融合维基知识的情境感知Web服务发现方法研究[D];武汉大学;2015年
3 胡亮;集成多元信息的推荐系统建模方法的研究[D];上海交通大学;2015年
4 孙丽梅;Web-based推荐系统中若干关键问题研究[D];东北大学;2013年
5 郑麟;基于属性提升与偏好集成的上下文感知推荐[D];武汉大学;2017年
6 于鹏华;数据数量与质量敏感的推荐系统若干问题研究[D];浙江大学;2016年
7 王宏宇;商务推荐系统的设计研究[D];中国科学技术大学;2007年
8 杨东辉;基于情感相似度的社会化推荐系统研究[D];哈尔滨工业大学;2014年
9 曹渝昆;基于神经网络和模糊逻辑的智能推荐系统研究[D];重庆大学;2006年
10 王立才;上下文感知推荐系统若干关键技术研究[D];北京邮电大学;2012年
相关硕士学位论文 前10条
1 朱孔真;基于云计算的电子商务智能推荐系统研究[D];武汉理工大学;2014年
2 郭敬泽;基于赋权评分和Dpark的分布式推荐系统研究与实现[D];天津理工大学;2015年
3 周俊宇;信息推荐系统的研究与设计[D];江南大学;2015年
4 李炜;基于电子商务平台的保险推荐系统的设计与实现[D];复旦大学;2013年
5 车丰;基于排序主题模型的论文推荐系统[D];大连海事大学;2015年
6 秦大路;基于因式分解机模型的上下文感知推荐系统研究[D];郑州大学;2015年
7 徐霞婷;动态路网监控与导航推荐系统的设计与实现[D];苏州大学;2015年
8 黄学峰;基于Hadoop的电影推荐系统研究与实现[D];南京师范大学;2015年
9 路小瑞;基于Hadoop平台的职位推荐系统的设计与实现[D];上海交通大学;2015年
10 李爱宝;基于组合消费行为分析的团购推荐系统的设计与实现[D];哈尔滨工业大学;2015年
,本文编号:1533915
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1533915.html