基于内容和社交网络的文本推荐系统的研究与实现
发布时间:2021-06-18 00:04
推荐模型是近年来互联网技术研究的一个热门趋势。但是传统的基于内容的推荐、基于社交网络的推荐和协同过滤的推荐都有各自的不足。为此,我们提出了基于内容和社交网络的推荐模型(RMBCS)。本文的主要内容有:(一)长-短文本间相似度的计算。目前长-短文本间没有计算相似度的公式,故本文提出了一个生成距离。本文通过对文本的分类、预处理、特征抽取,用特征计算生成距离得到长短文本间的相似度。(二)社交网络中用户最近邻群的选取。在用户数量巨大的系统中,用户最近邻群的选取耗时很多,为能快速便捷的选取用户的最近邻群,本文提出了从用户的社交网络中寻找最近邻群的新方法。(三)基于内容和社交网络的文本推荐系统的设计与实现。将以上两点内容嵌入推荐系统中,通过说明基于内容和社交网络的文本推荐系统的推荐方式,对系统进行需求分析、总体设计,并对系统的各模块进行详细设计,完成了该系统的设计与实现。最后对系统进行了测试。
【文章来源】:北京邮电大学北京市 211工程院校 教育部直属院校
【文章页数】:74 页
【学位级别】:硕士
【部分图文】:
图2-1社交网络中用户的入度??8??
于社区的社交网络数据[35]。??社交网络数据中存在长尾分布,主要根据用户的入度和出度,用户的入度反??映了用户的社会影响力,而用户的出度代表了一个用户关注的用户数[36:。从图2-??1和图2-2可以看出,一个社交网络中影响力大的用户总是占少数,同时关注很??多人的用户占少数,而绝大多数只关注很少的人[37]。??in?degree??10000000??????一????一?????—?—-??1000000???畢??100000??????10000??-—...???1〇〇〇??????100?--?-??10"??i?—-?—.^“-?--?—?---了—.—????1?10?100?1000?10000?丨?00000??图2-1社交网络中用户的入度??8??
滤词等操作,得到处理好的分词结果,同时对这些分词结果使用LDA主题模型,??得到文本的主题分布,再使用w〇rd2VeC进行词向量转化,得到文本的主题特征。??具体的文本主题特征向量的提取过程如图2-3所示。??11??
本文编号:3236172
【文章来源】:北京邮电大学北京市 211工程院校 教育部直属院校
【文章页数】:74 页
【学位级别】:硕士
【部分图文】:
图2-1社交网络中用户的入度??8??
于社区的社交网络数据[35]。??社交网络数据中存在长尾分布,主要根据用户的入度和出度,用户的入度反??映了用户的社会影响力,而用户的出度代表了一个用户关注的用户数[36:。从图2-??1和图2-2可以看出,一个社交网络中影响力大的用户总是占少数,同时关注很??多人的用户占少数,而绝大多数只关注很少的人[37]。??in?degree??10000000??????一????一?????—?—-??1000000???畢??100000??????10000??-—...???1〇〇〇??????100?--?-??10"??i?—-?—.^“-?--?—?---了—.—????1?10?100?1000?10000?丨?00000??图2-1社交网络中用户的入度??8??
滤词等操作,得到处理好的分词结果,同时对这些分词结果使用LDA主题模型,??得到文本的主题分布,再使用w〇rd2VeC进行词向量转化,得到文本的主题特征。??具体的文本主题特征向量的提取过程如图2-3所示。??11??
本文编号:3236172
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3236172.html
最近更新
教材专著