当前位置:主页 > 经济论文 > 电子商务论文 >

社会网络中基于用户评分数据的协同推荐研究

发布时间:2018-03-31 06:20

  本文选题:推荐系统 切入点:相似度计算 出处:《河南大学》2016年硕士论文


【摘要】:近些年来,随着信息技术的发展,电子商务领域积累了大量的数据,海量数据在为客户提供多样化商品选择的同时也带来了选择难的问题。推荐系统作为一种基于海量信息进行检索和筛选的个性化推送技术越来越受到人们的重视。它以客户的实际需求为中心,根据客户的历史行为数据预测用户的行为偏好,从而主动为客户提供个性化的数据信息服务。然而,在基于用户评分进行用户兴趣偏好建模的推荐系统中常常面临着一些不可避免的问题,如用户相似度计算精度问题、评分矩阵稀疏性问题。针对推荐系统中这两个常见的问题本文分别进行了探索,提出了一种新的计算用户相似度的计算方法,改善了传统相似度计算方法的不足;利用了物品的标签信息在一定程度上缓解了评分矩阵存在大量缺失值时不能很好的找出与目标用户具有相似偏好的用户的问题。具体来说,文中的贡献主要包含以下三个方面:(1)针对皮尔逊相似度在计算时遇到分母为0而相似度无法计算的情况,提出了一种改进方法,该方法能够根据用户评分情况适应选择合理的相似度计算方法。(2)基于mahout中已有的未知评分技术,结合评分项的标签信息提出了一种新的未知评分预测方法,该方法首先计算了用户对标签的兴趣分布,然后根据评分项包含标签的情况实现未知评分预测。(3)针对新提出的相似度计算方法和未知评分预测方法,结合mahout原有的方法进行了较好的集成。
[Abstract]:In recent years, with the development of information technology, the field of electronic commerce has accumulated a lot of data. Mass data not only provides customers with a variety of goods to choose, but also brings the problem of difficult choice. As a personalized push technology based on mass information retrieval and screening, recommendation system has been paid more and more attention to. It is centered on the actual needs of the customer, Based on the customer's historical behavior data, the user's behavior preference is predicted, thus providing personalized data information service for the customer. However, In the recommendation system of user interest preference modeling based on user score, there are some unavoidable problems, such as the accuracy of user similarity calculation. This paper explores the two common problems in recommendation system, and proposes a new method to calculate user similarity, which improves the deficiency of traditional similarity calculation method. The use of the label information of the items to some extent alleviates the problem of finding users with similar preferences to the target users when there are a large number of missing values in the scoring matrix. The contributions in this paper mainly include the following three aspects: 1) an improved method is proposed to solve the problem that Pearson's similarity can not be calculated when its denominator is zero. Based on the unknown scoring technology in mahout and the label information of scoring items, a new unknown score prediction method is proposed. Firstly, the distribution of users' interest in labels is calculated, and then unknown score prediction is realized according to the condition that labels are included in the scoring items. (3) for the new similarity calculation method and unknown score prediction method, Combined with the original method of mahout, better integration is carried out.
【学位授予单位】:河南大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.3

【相似文献】

相关期刊论文 前10条

1 郑炜冬;;试卷相似度自动评估技术的研究[J];智能计算机与应用;2011年06期

2 赵涛;肖建;;二型模糊相似度及其应用[J];计算机工程与应用;2013年08期

3 徐志明;李栋;刘挺;李生;王刚;袁树仑;;微博用户的相似性度量及其应用[J];计算机学报;2014年01期

4 李桂林,陈晓云;关于聚类分析中相似度的讨论[J];计算机工程与应用;2004年31期

5 秦玉平;杨兴凯;;基于案例推理的区间属性相似度研究[J];辽宁师范大学学报(自然科学版);2006年04期

6 蒋鹏;;基于本体的应急案例相似度算法研究[J];南昌高专学报;2009年03期

7 何亚;;词语相似度算法的分析与改进[J];硅谷;2011年24期

8 仇丽青;陈卓艳;;基于共同邻居相似度的社区发现算法[J];信息系统工程;2014年05期

9 焦鹏;唐见兵;查亚兵;;仿真可信度评估中相似度方法的改进及其应用[J];系统仿真学报;2007年12期

10 姜毅;乐庆玲;;一种基于兴趣相似度的学习社区算法[J];电脑知识与技术(学术交流);2007年16期

相关会议论文 前10条

1 刘海波;郑德权;赵铁军;;基于相似度线性加权方法的检索结果聚类研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年

2 陆劲挺;路强;刘晓平;;对比相似度计算方法及其在功能树扩展中的应用[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年

3 董刊生;方金云;;基于向量距离的词序相似度算法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年

4 刘晓平;陆劲挺;;任意功能树的物元相似度求解方法[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年

5 王茜;张卫星;;基于分类树相似度加权的协同过滤算法[A];2008年计算机应用技术交流会论文集[C];2008年

6 洪文学;王金甲;常凤香;宋佳霖;刘文远;王立强;;基于图形特征增强的相似度分类器的研究[A];中国生物医学工程进展——2007中国生物医学工程联合学术年会论文集(上册)[C];2007年

7 雷庆;吴扬扬;;一种基于语义信息计算XML文档相似度的新方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年

8 叶正;林鸿飞;杨志豪;;基于问句相似度的中文FAQ问答系统研究[A];第三届学生计算语言学研讨会论文集[C];2006年

9 罗辛;欧阳元新;熊璋;袁满;;通过相似度支持度优化基于K近邻的协同过滤算法[A];NDBC2010第27届中国数据库学术会议论文集A辑一[C];2010年

10 王健;刘衍珩;焦玉;;VANETs信任传播建模[A];中国通信学会通信软件技术委员会2009年学术会议论文集[C];2009年

相关重要报纸文章 前1条

1 王伽 卫江;出入境证件照片应及时更换[N];中国国门时报;2008年

相关博士学位论文 前10条

1 操震洲;矢量数据动态多尺度网络传输研究[D];南京大学;2015年

2 程亮;基于本体的疾病数据整合与挖掘方法研究[D];哈尔滨工业大学;2014年

3 刘振宇;基于区域相似度和特征降维的极化SAR影像分类[D];武汉大学;2013年

4 曹,

本文编号:1689522


资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/dianzishangwulunwen/1689522.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户73866***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com