基于隐因子学习的推荐系统研究

发布时间:2021-01-22 02:47
  推荐系统作为大数据环境下解决信息过载问题的关键性技术,其核心在于帮助用户更便捷地找到他们感兴趣的内容。内容资源越庞大时,推荐系统的存在意义就越大。而推荐算法便是推荐系统的核心,因此近年来针对推荐算法的研究具有重要的理论意义与应用价值。面对推荐系统中典型的用户-项目评分预测问题,本文改进了神经协同过滤模型,利用深度学习思想重构了隐因子模型的矩阵分解过程,结合向量化技术和神经网络来对用户和项目的隐因子进行抽象表示。同时结合特征交叉思想,进一步为模型引入了辅助特征向量帮助其更好的建模。实验对比中,本文改进后的模型预测RMSE稳定在0.8038,对比当下非深度学习领域最佳的非负矩阵分解模型,预测准确度提升了7%;对比主流的深度学习模型,本模型预测准确度提升了4%,有着比较明显的改善。在模型鲁棒性的研究中,本文尝试了噪音注入的思路,在基于隐因子学习的神经矩阵分解模型基础上提出了具有良好鲁棒性的版本。通过在模型中引入噪音层,模拟随机扰动,来增加模型在实际环境中面对恶意攻击的抗性。随后的实验结果也证明,加入噪音层后的新模型表现出更好的鲁棒性,面对同等条件的恶意攻击,针对新模型攻击的成功率下降了22.... 

【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校

【文章页数】:79 页

【学位级别】:硕士

【部分图文】:

基于隐因子学习的推荐系统研究


算法表现随数据规模的变化图

示意图,算法,示意图,用户行为


第二章经典推荐算法及隐因子模型9目)群体、计算相似性并推荐。依照原理的区别又分为基于领域和基于模型这两类。基于领域的方法中,根据所选取基准的不同,又可以进一步分类为以用户为中心和以项目为中心的两个分支。2.2.1基于用户的协同过滤以用户为中心的方法通过分析系统中已有历史行为抽象建模用户,匹配与该用户行为或兴趣高度重合的用户或群体,然后凭借高相似度用户或群体所喜欢项目来预测目标用户兴趣[3,12-15,51],算法原理如图2-1所示。图2-1基于用户的协同过滤算法示意图如图2-1所示关系,用户A以实线箭头指向了项目1和3,表示用户A对项目1和3表现出明显的喜好倾向。同理可以发现用户B和用户C分别偏爱项目2和项目1、3、4。通过分析用户的行为,图2-1所示的A和C用户拥有很高的重合度。同时,项目4属于C的偏好而A暂未发现,所以基于用户的方法会将项目4推荐给用户A(图2-1中虚线箭头)。量化计算过程中,用户间相似性的度量如公式(2-1)所示[51]:=|()∩()||()||()|(2-1)其中,下标和分别表示系统中的两个用户,用于衡量系统中用户之间的相似性,|()|表示由用户所喜欢的项目构成的集合中元素的个数,|()|同理。|()∩()|表示由集合()和()所产生交集中元素的个数,即两用户共同喜欢的项目数。分母表示归一化操作,作为限制项,惩罚活跃用户的贡献度。因为活跃用户行为过(喜欢)的项目集合很大,在系统中会和很多用户有重合的部分,影

示意图,算法,示意图,群体


电子科技大学硕士学位论文10响结果的准确性。=()∩(,)(2-2)对于系统中任意两个用户,可以通过公式(2-1)计算得到其特征重合度。然后便可以依靠用户群体以及相关性计算系统中的未知评分。公式(2-2)中和分别用于索引不同的用户和项目,预测结果表示为,()表示系统中所有对项目进行过评分的用户群体的集合,(,)表示与目标用户重合度最高的群体集合中的前个元素(用户),()∩(,)表示和用户最相似的个用户中且对项目进行过评分的用户的集合,为公式(2-1)中的相似度,为已观测到的评分(用户对项目)。2.2.2基于项目的协同过滤以项目为中心的方法拥有与以用户为中心的协同过滤类似的原理,主要的区别在于算法所关注的基准不同,基于项目的协同过滤方法着重于度量项目与项目之间的相似性[3,12-15,51]。图2-2基于项目的协同过滤算法示意图如图2-2所示关系,用户对项目的明确偏好依然使用实线箭头表示。分析图中的交互关系能够得出项目1和3有着相似的用户行为,可以归类为高相似度项目。然后根据用户C喜欢项目1的事实,把类似的项目3推荐给用户。量化计算过程也与前文同理[51]:=|()∩()||()||()|(2-3)


本文编号:2992396

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/2992396.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户31045***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com