融合用户聚类和协同过滤的新闻推荐系统设计与实现
发布时间:2021-06-26 00:39
自二十一世纪以来,互联网的飞速发展,给人们的生活带来很多便利。大数据时代到来,以自媒体的形式产生了大量数据并由大量用户进行传播,给用户提供了丰富的资源信息,人们获取资源信息已经从传统的报纸、广播等媒介,转向从网络中获取自己需要的资源信息,在网络上阅读在线新闻非常便捷,因此成为人们获取信息的一个重要来源,与此同时也带来了许多问题。海量的新闻资源使用户难以在大量的新闻数据中获取到所需要的新闻信息,这就造成了信息过载的问题。另一方面很多用户在浏览新闻时,并没有明确的新闻信息指向,无法快速获取有效信息。因此,在大量的新闻数据中收集真实准确的新闻,并根据用户的潜在兴趣对其做出相应的新闻推荐,满足用户的需求,并可以带来巨大的社会和经济价值。本文以融合用户聚类和协同过滤的新闻推荐系统设计与实现为研究课题,主要研究内容如下:(1)研究课题背景及意义,对本文涉及到的相关理论和技术进行研究,主要包括数据采集技术、聚类算法以及推荐技术。(2)在相关理论技术的基础上,研究融合用户聚类和协同过滤的新闻推荐技术。本文针对推荐系统中存在的冷启动、数据稀疏等问题,采用融合聚类的推荐技术,在现有的改进聚类的推荐技术基础...
【文章来源】:山东师范大学山东省
【文章页数】:53 页
【学位级别】:硕士
【部分图文】:
图1-1网民规模和互联网普及率??同时随着信息资源的不断膨胀,也带来了诸多问题
得了较好的结果,用户满意度相对较高。??国内具有新闻推荐的网站有今日头条、腾讯新闻、搜狐新闻客户端和百度新闻推荐??等。如图1-2所示,我们可以看出国内互联网巨头使用时长占比,今日头条从2016下半??年年用户活跃数量飞速增长,截止到2018年上半年,今日头条用户使用时长占据移动互??联网各巨头从3.9%猛增到10.1%,超过了百度、阿里成为使用时长的第二名。今日头条??有着丰富的推荐逻辑,比如基于文章关键字的推荐、基于社交好友关系的推荐、基于相??似文章主题相似的推荐等等一系列算法的结合使用,使得今日头条取得了大量用户的信??任[11]。从下图中的数据可以看出,新闻推荐发展决定了整个系统的用户使用率,用户量??多会给整个系统带来巨大的社会经济效益。国内大部分新闻推荐系统,大多使用协同过??滤算法或将多算法进行融合来解决对海量新闻数据进行推荐的问题。??3??
户提供便利。随着互联网的飞速发展,网页内容不仅限于文本信息,还包括视频信息、??音频信息、超链接等,在采集的过程中超链接将作为待采集的URL放入队列中,进行下??一步的采集。一般通用网络爬虫的整体框架图如图2-1所示。??9??
本文编号:3250274
【文章来源】:山东师范大学山东省
【文章页数】:53 页
【学位级别】:硕士
【部分图文】:
图1-1网民规模和互联网普及率??同时随着信息资源的不断膨胀,也带来了诸多问题
得了较好的结果,用户满意度相对较高。??国内具有新闻推荐的网站有今日头条、腾讯新闻、搜狐新闻客户端和百度新闻推荐??等。如图1-2所示,我们可以看出国内互联网巨头使用时长占比,今日头条从2016下半??年年用户活跃数量飞速增长,截止到2018年上半年,今日头条用户使用时长占据移动互??联网各巨头从3.9%猛增到10.1%,超过了百度、阿里成为使用时长的第二名。今日头条??有着丰富的推荐逻辑,比如基于文章关键字的推荐、基于社交好友关系的推荐、基于相??似文章主题相似的推荐等等一系列算法的结合使用,使得今日头条取得了大量用户的信??任[11]。从下图中的数据可以看出,新闻推荐发展决定了整个系统的用户使用率,用户量??多会给整个系统带来巨大的社会经济效益。国内大部分新闻推荐系统,大多使用协同过??滤算法或将多算法进行融合来解决对海量新闻数据进行推荐的问题。??3??
户提供便利。随着互联网的飞速发展,网页内容不仅限于文本信息,还包括视频信息、??音频信息、超链接等,在采集的过程中超链接将作为待采集的URL放入队列中,进行下??一步的采集。一般通用网络爬虫的整体框架图如图2-1所示。??9??
本文编号:3250274
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3250274.html