分布式环境中一种带有隐私保护的矩阵分解推荐方法
发布时间:2021-01-27 01:18
互联网的出现和普及给用户带来便利的同时产生了大量的信息。为了帮助人们做出提供选择快速决策,推荐系统需要收集用户的历史数据进行建模分析,来实现推荐服务。矩阵分解推荐算法是协同过滤中最受欢迎的算法之一,有较高的推荐精确度。传统的矩阵分解方法主要应用于集中式环境中,用户需要把各自的历史数据提供给服务器,对于不受信任的推荐服务器,存在隐私泄露的风险。随着个人信息泄露的情况在不断的出现,人们越来越重视隐私保护问题,更多的数据拥有者不愿意提供自身的数据,因此,应用于分布式推荐系统中的矩阵分解算法应运而生。为了解决分布式推荐系统中的隐私问题,现有的做法主要分为两种,一种是基于数据扰动的方式来保护数据的安全,通过差分隐私加噪的方法,或采用随机扰动,将梯度数据加噪扰动后再发送到服务器聚合通常因为保护数据的隐私性而牺牲了部分的数据效用性,因此导致推荐效果的下降。另一种则采用加密的方法来保证数据的无损失计算,利用同态性质进行加密计算保证模型训练过程中数据安全性的同时不降低推荐的精度。但是采用同态加密等算法,伴随大量的加密解密过程,因而降低了整个推荐算法的时间效率。基于现有的工作,主要关注分布式推荐下的矩阵分...
【文章来源】:广西师范大学广西壮族自治区
【文章页数】:58 页
【学位级别】:硕士
【部分图文】:
中国网民规模和互联网普率
广西师范大学硕士研究生学位论文7第2章推荐系统、隐私保护方法概述2.1推荐系统的概述及主要方法推荐系统的早期研究源于信息检索和过滤,可以把推荐系统理解为一个智能系统,能够根据用户的兴趣偏好筛选用户感兴趣的服务或物品。开发推荐系统的目的是通过从大量异构复杂数据中检索出最相关的信息来减少信息过载,从而提供个性化服务。目前的推荐系统可主要分为基于协同过滤与基于内容的推荐算法,还有混合推荐算法。定义2.1(推荐系统[34]):设C表示为用户集合,S可以是所有可能的推荐项目集合,u是一个效用函数,用于衡量项目(s∈S)对用户(c∈C)的有效性,即U:C×S→R,其中R是一个完全有序的集合。用户和项目集合都可能非常大,对于每个用户c∈C,我们要选择这样的项目s"∈S最大限度地提高效用函数u,即:c),(maxargS"scuCSsc,(2.1)在推荐系统应用程序中,通常有两类实体,一般分为为用户和项目(如电影,商品,音乐,书籍等)两类,项目的效用通常是以评分表示,表示一个用户是否喜欢这个项目的。如评分等级为1到5,则电影被用户评为5表示用户高度喜欢它,而1评级表示不喜欢,而推荐系统目的在于对那些用户还未有评分的项目进行预测评分,而进行预测后最终的目的是选取出前N项项目推荐给用户。在推荐系统中,最核心的工作模块就是推荐算法,整个系统的工作需要用户的反馈进行优化调整,以便为用户提供更精确的推荐。工作流程如下图2.1:图2.1推荐系统工作流程2.1.1基于协同过滤推荐算法
广西师范大学硕士研究生学位论文10图2.2标题转换向量空间与协同过滤推荐算法不同,基于内容的推荐算法,用户之间是独立的,每个用户的偏好都是依据他本身对项目的喜好获得的,与他人的行为无关这点与协同过滤正好相反。这样就使得基于内容的推荐算法存在一些协同过滤中没有的优势,例如新产生的项目可以立刻被推荐,基于内容的算法关注内容关联性本身,而协同过滤需要被某些用户有过打分历史才会被推荐给其他用户。当然基于内容的推荐算法也存在着不足,例如新用户没有喜好历史,自然无法获得他的特征,所以也就无法为他产生推荐内容了。由于基于内容推荐算法的一些缺点,目前大部分的推荐系统都是以其他算法为主(如协同过滤算法),而将其作为辅助使用来解决主算法在某些情况下的不精确性(如解决新项目问题)。2.1.3基于混合的推荐算法基于混合的方法通常结合多种推荐算法。为了能够克服单个推荐算法存在的缺点,提高推荐性能,尤其是对于新用户或者新项目,传统用户协同过滤算法和基于内容的算法,无法给出很好的推荐。混合推荐算法通常采取特征组合,加权混合,并行推荐算法混合等方法实现[38]。将协同过滤和基于内容的推荐进行组合[39]是十分常用的方案,首先基于内容的推荐算法使用朴素贝叶斯分类算法,填补评分矩阵中的缺失项,然后使用协同过滤算法对评分矩阵进行进一步的计算。与单个推荐算法相比,克服了评分稀疏的问题,从而提高推荐精确度。2.2推荐系统中的隐私保护技术为了生成准确的个性化推荐,推荐系统依赖于用户偏好的详细个人数据。例如评分,消费记录和个人资料。推荐系统为人们提供了很大的帮助,但是推荐系统收集和处理个人数据相关的隐私风险常常被低估或忽略,推荐系统进行用户数据的收集,对于用户层面,许?
本文编号:3002160
【文章来源】:广西师范大学广西壮族自治区
【文章页数】:58 页
【学位级别】:硕士
【部分图文】:
中国网民规模和互联网普率
广西师范大学硕士研究生学位论文7第2章推荐系统、隐私保护方法概述2.1推荐系统的概述及主要方法推荐系统的早期研究源于信息检索和过滤,可以把推荐系统理解为一个智能系统,能够根据用户的兴趣偏好筛选用户感兴趣的服务或物品。开发推荐系统的目的是通过从大量异构复杂数据中检索出最相关的信息来减少信息过载,从而提供个性化服务。目前的推荐系统可主要分为基于协同过滤与基于内容的推荐算法,还有混合推荐算法。定义2.1(推荐系统[34]):设C表示为用户集合,S可以是所有可能的推荐项目集合,u是一个效用函数,用于衡量项目(s∈S)对用户(c∈C)的有效性,即U:C×S→R,其中R是一个完全有序的集合。用户和项目集合都可能非常大,对于每个用户c∈C,我们要选择这样的项目s"∈S最大限度地提高效用函数u,即:c),(maxargS"scuCSsc,(2.1)在推荐系统应用程序中,通常有两类实体,一般分为为用户和项目(如电影,商品,音乐,书籍等)两类,项目的效用通常是以评分表示,表示一个用户是否喜欢这个项目的。如评分等级为1到5,则电影被用户评为5表示用户高度喜欢它,而1评级表示不喜欢,而推荐系统目的在于对那些用户还未有评分的项目进行预测评分,而进行预测后最终的目的是选取出前N项项目推荐给用户。在推荐系统中,最核心的工作模块就是推荐算法,整个系统的工作需要用户的反馈进行优化调整,以便为用户提供更精确的推荐。工作流程如下图2.1:图2.1推荐系统工作流程2.1.1基于协同过滤推荐算法
广西师范大学硕士研究生学位论文10图2.2标题转换向量空间与协同过滤推荐算法不同,基于内容的推荐算法,用户之间是独立的,每个用户的偏好都是依据他本身对项目的喜好获得的,与他人的行为无关这点与协同过滤正好相反。这样就使得基于内容的推荐算法存在一些协同过滤中没有的优势,例如新产生的项目可以立刻被推荐,基于内容的算法关注内容关联性本身,而协同过滤需要被某些用户有过打分历史才会被推荐给其他用户。当然基于内容的推荐算法也存在着不足,例如新用户没有喜好历史,自然无法获得他的特征,所以也就无法为他产生推荐内容了。由于基于内容推荐算法的一些缺点,目前大部分的推荐系统都是以其他算法为主(如协同过滤算法),而将其作为辅助使用来解决主算法在某些情况下的不精确性(如解决新项目问题)。2.1.3基于混合的推荐算法基于混合的方法通常结合多种推荐算法。为了能够克服单个推荐算法存在的缺点,提高推荐性能,尤其是对于新用户或者新项目,传统用户协同过滤算法和基于内容的算法,无法给出很好的推荐。混合推荐算法通常采取特征组合,加权混合,并行推荐算法混合等方法实现[38]。将协同过滤和基于内容的推荐进行组合[39]是十分常用的方案,首先基于内容的推荐算法使用朴素贝叶斯分类算法,填补评分矩阵中的缺失项,然后使用协同过滤算法对评分矩阵进行进一步的计算。与单个推荐算法相比,克服了评分稀疏的问题,从而提高推荐精确度。2.2推荐系统中的隐私保护技术为了生成准确的个性化推荐,推荐系统依赖于用户偏好的详细个人数据。例如评分,消费记录和个人资料。推荐系统为人们提供了很大的帮助,但是推荐系统收集和处理个人数据相关的隐私风险常常被低估或忽略,推荐系统进行用户数据的收集,对于用户层面,许?
本文编号:3002160
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3002160.html