基于词向量的标签语义推荐算法研究
发布时间:2020-06-21 21:15
【摘要】:在Web2.0的环境下,鼓励用户创造内容是主基调。社会化标签作为一种使用灵活、对用户友好、无约束的分类方式,在业界得到了广泛的应用。社会标签具备组织、分享、检索和发现新资源、新用户等良好特性。但同样也存在标签分布稀疏、标签使用率低、用户标注随意以致出现噪声标签甚至恶意标签等情况。为趋利避害,标签推荐技术应运而生,得到学界的广泛关注,也成为推荐系统的热门研究方向。本文围绕社会标签系统的标签推荐技术展开。具体工作如下:第一、本文首先对推荐系统的组成以及推荐原理进行介绍,并对目前标签推荐技术的文献进行梳理,对算法分类整理并总结优缺点,为后续在标签推荐技术领域的研究提供一定的参考。本文发现目前大多数的标签推荐技术缺乏对标签语义的研究,而且现有的标签语义研究适用范围有限。因此提出基于词向量的标签语义推荐算法,以开发出兼具内容过滤和协同过滤优越性的标签推荐技术。第二、本文采用了Skip-gram算法计算标签相似度。与目前主流的Wu Palmer概念相似度算法相比,具备三个优点:一是适用范围更广,Wu Palmer概念相似度算法仅局限于英文;二是词语对象完备,Wu Palmer概念相似度算法是建立在WordNet语义层次结构上,然而WordNet语义字典只收录155287个词语,无法对超出字典的词语进行处理;三是能计算短语的相似度。WordNet字典无法解析短语,如"less than 300 ratings",标签系统中类似的短语标签是很常见的。总而言之,Skip-gram算法在标签推荐领域实用性更强。第三、本文提出的基于词向量的标签语义推荐算法,结合了神经网络语言模型和匈牙利算法,较好地解决了标签与标签相似度和用户与用户之间相似度计算问题。并通过实验,与现有算法比较,在推荐精度上有一定的提高。
【学位授予单位】:广东工业大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:H030
【图文】:
逑(邋社群影响邋飞逡逑图3-1社群影响和个人意向之间的关系逡逑Fig邋3-1邋The邋relationship邋between邋the邋social邋influence邋and邋personal邋intention逡逑3.2社会标签系统模型逡逑社会化标签系统由用户、资源、标签三类对象和一种标注行为构成,如图3-2所逡逑不。逡逑r>9P邋同逡逑
本文编号:2724650
【学位授予单位】:广东工业大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:H030
【图文】:
逑(邋社群影响邋飞逡逑图3-1社群影响和个人意向之间的关系逡逑Fig邋3-1邋The邋relationship邋between邋the邋social邋influence邋and邋personal邋intention逡逑3.2社会标签系统模型逡逑社会化标签系统由用户、资源、标签三类对象和一种标注行为构成,如图3-2所逡逑不。逡逑r>9P邋同逡逑
本文编号:2724650
本文链接:https://www.wllwen.com/wenyilunwen/yuyanxuelw/2724650.html