基于相似度神经网络的协同标注模型
发布时间:2021-09-19 17:21
协同标注作为一种成熟的技术,常被用来解决信息资源索引、管理、检索等问题,但存在因数据间交互信息不充分或无交互信息带来的冷启动问题。目前常用的解决办法是采用内容信息来增强和改善注释算法,尤其是基于文本内容的协同过滤,但对于如何更好地提取文本特征、衡量项目相似性等还需要深入探究。针对以上问题,本文结合稀疏线性方法(Sparse Linear Method,SLIM)和孪生卷积神经网络(Siamese Convolution Neural Network,SCNN)提出了一种基于相似度神经网络的协同标注模型(Similarity Neural Network based Collaborative Annota-tion Model,SNNCA)。该模型将SCNN组件用于内容信息的特征提取和项目相似性计算,其输出可视为两个输入内容的非线性相似性度量函数。为了解决SCNN的参数训练问题,本文通过SLIM从已有项目标注数据中学习项目间的相似关系稀疏系数矩阵W,将获得的结果用于训练SCNN组件中的参数。基于此思路,本文专门设计了模型参数学习方法,并通过交叉迭代方式,实现模型参数的联合优化,即每次迭...
【文章来源】:云南大学云南省 211工程院校
【文章页数】:52 页
【学位级别】:硕士
【部分图文】:
图2.2:?TextCNN模型特征提取过程PI??
云南大学【专业)硕士学位论文??明的,后来被证明将其应用于NLP具有很好的效果,如TextCNN(TextConvolution??Neural?Network127])被广泛应用于文本分类,其模型结构如图2.2所不。首先将文??本通过词嵌入的方式表示为词向量的形式。其次通过训练一个带有卷积层的简单??CNN提取文本特征,通过池化等操作对特征进行降维。最后根据任务要求将特征??输入全连接层的函数作为结果输出。??size:(2,3,4)*5??(1lters:2??Embedding?/?convH?INIax-pooling??"ke?=?=?=??=?=?=?=?=?二??=3:二===?二二二二="團?fea"f.re??.??????^?.一^?I?'?vector??much???.?I??A?選?J??图2.2:?TextCNN模型特征提取过程PI??卷积是CNN中的重要操作,卷积其实就是卷积核作用于神经网络输入上的点??乘和,加上偏置之后的激活输出。卷积核是一个自定义大小的滑动窗口,其个数也??是人为设定的,不同大小的卷积核中的权重参数不同,这样可以保证不同的卷积核??在卷积的过程中对同一区域采集的特征不同,保证提取出所有明显的特征。卷积过??程如下图2.3所示。??tj=5?2*5?filters????????stride?1??iL??likej??'?■■■??graphHHHHHB?一?一--■??
图2.4:池化操作??
【参考文献】:
期刊论文
[1]基于社会化标注的用户兴趣发现及个性化推荐研究[J]. 王晓耘,赵菁,徐作宁. 现代情报. 2018(07)
[2]基于余弦相似度模型的最佳教练遴选算法[J]. 陈大力,沈岩涛,谢槟竹,马颖异. 东北大学学报(自然科学版). 2014(12)
[3]一种用于社会化标签推荐的主题模型[J]. 孙甲申,王小捷. 北京邮电大学学报. 2014(03)
[4]基于社会网络分析的协同推荐方法改进[J]. 冯勇,李军平,徐红艳,党晓婉. 计算机应用. 2013(03)
博士论文
[1]文本分类及其相关技术研究[D]. 尚文倩.北京交通大学 2007
硕士论文
[1]文本分类中特征选择和特征加权算法的研究[D]. 杜同森.北京邮电大学 2014
[2]文本聚类分析效果评价及文本表示研究[D]. 周昭涛.中国科学院研究生院(计算技术研究所) 2005
本文编号:3402022
【文章来源】:云南大学云南省 211工程院校
【文章页数】:52 页
【学位级别】:硕士
【部分图文】:
图2.2:?TextCNN模型特征提取过程PI??
云南大学【专业)硕士学位论文??明的,后来被证明将其应用于NLP具有很好的效果,如TextCNN(TextConvolution??Neural?Network127])被广泛应用于文本分类,其模型结构如图2.2所不。首先将文??本通过词嵌入的方式表示为词向量的形式。其次通过训练一个带有卷积层的简单??CNN提取文本特征,通过池化等操作对特征进行降维。最后根据任务要求将特征??输入全连接层的函数作为结果输出。??size:(2,3,4)*5??(1lters:2??Embedding?/?convH?INIax-pooling??"ke?=?=?=??=?=?=?=?=?二??=3:二===?二二二二="團?fea"f.re??.??????^?.一^?I?'?vector??much???.?I??A?選?J??图2.2:?TextCNN模型特征提取过程PI??卷积是CNN中的重要操作,卷积其实就是卷积核作用于神经网络输入上的点??乘和,加上偏置之后的激活输出。卷积核是一个自定义大小的滑动窗口,其个数也??是人为设定的,不同大小的卷积核中的权重参数不同,这样可以保证不同的卷积核??在卷积的过程中对同一区域采集的特征不同,保证提取出所有明显的特征。卷积过??程如下图2.3所示。??tj=5?2*5?filters????????stride?1??iL??likej??'?■■■??graphHHHHHB?一?一--■??
图2.4:池化操作??
【参考文献】:
期刊论文
[1]基于社会化标注的用户兴趣发现及个性化推荐研究[J]. 王晓耘,赵菁,徐作宁. 现代情报. 2018(07)
[2]基于余弦相似度模型的最佳教练遴选算法[J]. 陈大力,沈岩涛,谢槟竹,马颖异. 东北大学学报(自然科学版). 2014(12)
[3]一种用于社会化标签推荐的主题模型[J]. 孙甲申,王小捷. 北京邮电大学学报. 2014(03)
[4]基于社会网络分析的协同推荐方法改进[J]. 冯勇,李军平,徐红艳,党晓婉. 计算机应用. 2013(03)
博士论文
[1]文本分类及其相关技术研究[D]. 尚文倩.北京交通大学 2007
硕士论文
[1]文本分类中特征选择和特征加权算法的研究[D]. 杜同森.北京邮电大学 2014
[2]文本聚类分析效果评价及文本表示研究[D]. 周昭涛.中国科学院研究生院(计算技术研究所) 2005
本文编号:3402022
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3402022.html