基于LDA-LR推荐算法在个性化新闻推荐系统中的应用
发布时间:2022-01-25 11:44
随着社会科技的不断发展,人们已经迈入到了大数据时代,与此同时各类数据信息呈指数级爆炸式增长,使得用户无法有效的在海量的数据信息中找到符合自身兴趣的新闻信息,因此个性化新闻推荐系统应运而生。常见的个性化新闻推荐系统内部的推荐算法一般采用的是基于用户的协同过滤算法,它通过用户历史浏览的新闻所包含的关键词这一维度对用户之间的相似度进行计算,然后给用户推荐与他相似度比较高的其他用户所浏览的新闻内容。但是这种基于关键词的推荐算法所推荐的内容覆盖范围较窄,无法满足用户对推荐系统多样性的要求。经过研究分析,我们发现用户对新闻的喜好程度单纯的以关键词这个维度去做决策是不太合适的。对于新闻这种文本类数据,它本身都是包含语义属性的,而常见的个性化新闻推荐系统着眼于新闻关键词进行新闻推荐,忽略了新闻本身所包含的潜在语义,例如多篇描述同一个关键词、同一个热点事件的新闻,往往只有一篇或少数几篇能够脱颖而出,造成这种现象的原因是这些新闻在行文构成和语义表述上更加博人眼球。因此常见的个性化新闻推荐系统存在推荐结果不精确,用户满意率低等缺陷。针对这种情景,本文提出了一种基于LDA-LR的个性化新闻推荐方法。首先LDA...
【文章来源】:天津理工大学天津市
【文章页数】:48 页
【学位级别】:硕士
【部分图文】:
传统个性化新闻推荐系统架构图
第二章 传统的个性化新闻推荐系统( ) ( )( ) ( )abE a E bIE a E b (2到上述兴趣相似度计算公式后,就可以对所有用户进行相似度的计算,以完成群体的划分。但是当面临大量的用户群体的时候,我们不难发现,对所有的用间都进行相似度计算公式的运算将会产生很大的计算量,然而在实际当中,有分用户没有对同一条新闻进行阅读和评论的数据,所以公式 2-1 中的E b 0,因此对这部分数据进行排除,先计算出E a E b 0 的用户对 ( a ,b可以通过建立新闻关键词到用户的倒排表如图 2-2 所示,这样可以很大程度上的计算量。
P ( | )= P ( | ) P( | )主题词语文档 词语主题 主题文档Unigram Model)将一篇包含 N 个词的文档生成的过程,每抛一次就随机生成一个词,每次生成词的概率是独立相互独立的,这个过程又可以看作是一个不考虑顺序的多l 就是通过计算多项分布概率模型,从而得到文档和语料和主题是已经固定好的,例如一篇含有 N 个词的文档 H 知,生成词nh 的概率为每次独立抛掷骰子的过程记为 (P h的概率如公式 3-2 所示:1( ) ( )NnnP H P h 示如下图 3-1 所示(其中 H 表示 H 篇文档,N 表示总共):
【参考文献】:
期刊论文
[1]基于内容的推荐与协同过滤融合的新闻推荐方法[J]. 杨武,唐瑞,卢玲. 计算机应用. 2016(02)
[2]基于项目的协同过滤推荐算法的改进[J]. 黄典. 中国科技信息. 2016(01)
[3]大数据与推荐系统[J]. 李翠平,蓝梦微,邹本友,王绍卿,赵衎衎. 大数据. 2015(03)
[4]自然语言处理中主题模型的发展[J]. 徐戈,王厚峰. 计算机学报. 2011(08)
[5]一种结合词项语义信息和TF-IDF方法的文本相似度量方法[J]. 黄承慧,印鉴,侯昉. 计算机学报. 2011(05)
[6]基于LSA和SVM的文本分类模型的研究[J]. 王永智,滕至阳,王鹏,聂江涛. 计算机工程与设计. 2009(03)
本文编号:3608476
【文章来源】:天津理工大学天津市
【文章页数】:48 页
【学位级别】:硕士
【部分图文】:
传统个性化新闻推荐系统架构图
第二章 传统的个性化新闻推荐系统( ) ( )( ) ( )abE a E bIE a E b (2到上述兴趣相似度计算公式后,就可以对所有用户进行相似度的计算,以完成群体的划分。但是当面临大量的用户群体的时候,我们不难发现,对所有的用间都进行相似度计算公式的运算将会产生很大的计算量,然而在实际当中,有分用户没有对同一条新闻进行阅读和评论的数据,所以公式 2-1 中的E b 0,因此对这部分数据进行排除,先计算出E a E b 0 的用户对 ( a ,b可以通过建立新闻关键词到用户的倒排表如图 2-2 所示,这样可以很大程度上的计算量。
P ( | )= P ( | ) P( | )主题词语文档 词语主题 主题文档Unigram Model)将一篇包含 N 个词的文档生成的过程,每抛一次就随机生成一个词,每次生成词的概率是独立相互独立的,这个过程又可以看作是一个不考虑顺序的多l 就是通过计算多项分布概率模型,从而得到文档和语料和主题是已经固定好的,例如一篇含有 N 个词的文档 H 知,生成词nh 的概率为每次独立抛掷骰子的过程记为 (P h的概率如公式 3-2 所示:1( ) ( )NnnP H P h 示如下图 3-1 所示(其中 H 表示 H 篇文档,N 表示总共):
【参考文献】:
期刊论文
[1]基于内容的推荐与协同过滤融合的新闻推荐方法[J]. 杨武,唐瑞,卢玲. 计算机应用. 2016(02)
[2]基于项目的协同过滤推荐算法的改进[J]. 黄典. 中国科技信息. 2016(01)
[3]大数据与推荐系统[J]. 李翠平,蓝梦微,邹本友,王绍卿,赵衎衎. 大数据. 2015(03)
[4]自然语言处理中主题模型的发展[J]. 徐戈,王厚峰. 计算机学报. 2011(08)
[5]一种结合词项语义信息和TF-IDF方法的文本相似度量方法[J]. 黄承慧,印鉴,侯昉. 计算机学报. 2011(05)
[6]基于LSA和SVM的文本分类模型的研究[J]. 王永智,滕至阳,王鹏,聂江涛. 计算机工程与设计. 2009(03)
本文编号:3608476
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3608476.html
最近更新
教材专著