基于自动编码器及子群组的协同过滤推荐算法研究

发布时间:2021-10-23 01:49
  随着大数据时代的到来,各大互联网公司对数据越来越重视,各大国内外的电商网站的实际需求是推进推荐算法研究的动力。国内外的电商网站和社交网络,最常见的推荐算法是根据用户的历史行为数据来推荐用户可能会购买的或者感兴趣的商品或者话题。协同过滤作为目前推进系统中应用最为广泛的算法,也是未来推荐系统的重点研究对象和推荐系统的发展方向。其优势在于能通过用户-商品的评分矩阵来挖掘出用户的隐藏特征,并且其处理复杂信息的能力能够使其很好的适用于实际应用环境。针对协同过滤存在如数据稀疏性、冷启动等问题。本文结合商品的评论信息来进一步改进算法,标签生成采用抽取关键词来完成,进一步通过改进的自动编码器从标签中挖掘出商品特征矩阵,填充好原始矩阵后,依据上下文语义划分子群组,最后利用预测结果好的子矩阵来产生近似矩阵从而得到预测结果。具体如下:针对评论语料随意性、无结构、口语化等特点,现有的标签提取的方法从评论短文本中提取出的标签存在标签冗余、语义不独立等问题。因此改进了K-means聚类的标签生成方法,该方法保证语义独立的同时依据其每个聚类中标签分数值来选取商品标签。实验结果表明改进的方法保证标签相互独立的同时保证... 

【文章来源】:昆明理工大学云南省

【文章页数】:73 页

【学位级别】:硕士

【部分图文】:

基于自动编码器及子群组的协同过滤推荐算法研究


矩阵分解示意图

矩阵图,矩阵,实例,算法


昆明理工大学专业学位硕士学位论文40缺失值。其中本节的迁移学习的方法主要参考的是CBT[33](CodeBookTransfer)。本文改进的方法的区别在于,CBT算法应用于不同的数据集之间的迁移学习。而在本节中用同一个原始矩阵的相对稠密的子群组迁移学习来产生近似矩阵。在接下来本章节将详细解释如何构建近似矩阵,如下图5.4所示。图5.4子评分矩阵构建近似矩阵的实例本文构建近似矩阵借鉴了CBT[33]算法的第二步,第二步作用是把原始矩阵R中全部商品和用户分别映射到子评分矩阵tSR的列和行,每个列和行分别作为商品簇和用户簇。此映射用数学符号表示为:用户角色矩阵MU和商品角色矩阵MV,映射后每个用户向量都持有其用户簇的标记,映射后每个商品向量都持有其商品簇的标记。其中tSR对应于CBT中定义的B,也就是“码本”(CodeBook)。结合上面的数学定义,R的近似矩阵计算公式如下:tTMSMRURV(5.3)上式中,原始矩阵R和子评分矩阵tSR已知,用户角色矩阵MU和商品角色矩阵MV则是未知的。所以这个问题的核心转换为求解最优化MU和MV。如下公式给出了最优化的数学表示。2mintTMSMRURVWF(5.4)上式中MU是mk的{0,1}二进制矩阵,MV是kl的{0,1}二进制矩阵,子评分矩阵tSR是kl的矩阵,这里我们R相同大小的指示矩阵W来掩盖未观察到的实体,如果ijR被评分,则ijW=1否则ijW=0。o代表两个矩阵的Hadamard乘积。

【参考文献】:
期刊论文
[1]基于堆栈降噪自编码器改进的混合推荐算法[J]. 杨帅,王鹃.  计算机应用. 2018(07)
[2]基于LSTM网络的序列标注中文分词法[J]. 任智慧,徐浩煜,封松林,周晗,施俊.  计算机应用研究. 2017(05)
[3]基于自动编码器组合的深度学习优化方法[J]. 邓俊锋,张晓龙.  计算机应用. 2016(03)
[4]推荐系统研究进展[J]. 朱扬勇,孙婧.  计算机科学与探索. 2015(05)
[5]用户评论中的标签抽取以及排序[J]. 李丕绩,马军,张冬梅,韩晓晖.  中文信息学报. 2012(05)
[6]基于效用的个性化推荐方法[J]. 吴兵,叶春明.  计算机工程. 2012(04)

博士论文
[1]推荐系统中协同过滤算法若干问题的研究[D]. 张亮.北京邮电大学 2009



本文编号:3452237

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3452237.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b1794***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com