面向小样本的新闻动态推荐模型的研究
发布时间:2021-09-08 07:34
个性化推荐系统能够推送给我们想了解的信息,加快人们对信息的获取速度。由于新闻推荐领域中用户兴趣模型往往会随行为信息的变化产生波动,传统的新闻推荐算法不适合基于小样本数据的新闻推荐。因此如何利用小样本数据建立用户兴趣模型以及降低文本分类训练中数据的复杂度成为个性化新闻推荐的关键。神经网络技术的发展,为面向小样本的新闻动态推荐模型的研究提供了新的契机。小样本数据集的特点是样本数量少、特征维度高,在神经网络训练中,如果直接对它进行特征选择,易导致算法的损失函数呈震荡式下降趋势,造成过拟合现象,且得到的用户兴趣模型性能也不稳定。评价推荐结果的主要指标是分类准确性和用户召回率,与文本分类模型好坏有直接关系,而类间特征项区分度的强弱以及类内特征项依赖性的高低是界定模型好坏的关键。围绕上述问题,论文主要做了如下工作:(1)为避免用户模型的损失函数因小样本训练数据而呈现震荡式下降导致特征过拟合问题,提出了基于神经网络的Bi-PSO算法。该算法采用向前搜索方法,根据候选特征与已选特征的相互关系(冗余或依赖)赋予权值;基于PSO思想限定算法学习因子(81和(82...
【文章来源】:江苏大学江苏省
【文章页数】:74 页
【学位级别】:硕士
【部分图文】:
网络新闻用户占网民比例新闻推荐系统在学术领域也受到了越来越多的重视,随着推荐系统愈发深入的
面向小样本的新闻动态推荐模型的研究4基于对特征子集评价标准特征选择方法的核心是对特征子集的评价方法,评价方法的好坏直接影响着特征子集的准确性。这种基于评价方法的特征选择算法与后续的自然语言处理算法是互相独立的,可单独进行训练,常用的特征子集评价方法有Filter模型、Wrapper模型、Embedded模型。目前,Vinyals等人利用数据集训练attention(注意力机制)模型[13],将一个标记的训练集和一个未标记的测试集映射到网络标签中,进行微调以适应新的特征集,来解决one-shotlearning(小样本)问题;柳青林等人在LeCun提出的孪生网络基础上引入迁移学习算法[14],利用YOLOv2算法模型参数,对损失函数进行修改,采取局部放大策略提高算法的性能。目前还提出了K-近邻模型、范数支持向量机、低秩矩阵近似等特征选择方法,这些特征选择方法在特征间冗余处理方面还需进一步研究。信息量爆炸的大数据时代,使得数据成为领域研究重要依据的同时也存在数据特征维度高、特征相关性强的问题,给神经网络领域的发展产生一定的阻碍[15]。良好的特征选择方法能够节省获取原始数据的时间,在自然语言处理方面可以缩减数据存储空间,更快获得数据模型,特征选择能够保留数据的原始特征,使算法具有良好的可解释性。1.2.3新闻推荐研究现状20世纪90年代,随着第一篇基于协同过滤算法的推荐技术论文[16]发表后,研究者开始致力于个性化推荐技术领域的发展。图1.2推荐系统基本工作原理图个性化推荐技术属于信息处理范畴,通过建立用户与数据信息之间的关联关系,依据用户的某种需求向用户推荐出符合用户需要的信息,过滤掉与用户需求无关的信息,最终实现用户的个性化推荐。根据信息和用户之间的关联关系,可将个
面向小样本的新闻动态推荐模型的研究12征权值使得卷积神经网络中的信息误差最校卷积神经网络以卷积层、采样层、池化层为基本网络结构,各网络层之间相互衔接,以多维网络层作为输出端,使训练结果的维度具有灵活性。图2.2卷积神经网络结构卷积神经网络的基本网络结构层:(1)卷积层卷积层的主要工作是将特征向量和卷积核做卷积运算,卷积层又称为特征提取层,如图2.3所示,将一个大小为55的特征向量进行卷积计算,提取特征信息的卷积核大小为33,最终得到计算结果3。图2.3卷积计算原理其中,第三个矩阵中标红的数字3是计算结果,特征向量和卷积核的计算公式如公式2.1所示,将特征向量矩阵中标红的33矩阵与卷积核33矩阵中的对应项进行与运算得到计算结果。特征图的维度与卷积核的维度无关,例如一个nn维的特征矩阵,经过一个mm维的卷积核运算后会得到(nm1)(nm1)维的特征矩阵。假设iC是矩阵第i层的特征值,iC生成过程如公式2.2所示,矩阵第i层的特征值iC的生成公式中,第i层卷积核的权值向量用表示,第i层的偏置量用表示。010101110010=0&1+1&0+0&1+1&0+1&1+0&0+1&1+1&1+0&0=3110110(2.1)
【参考文献】:
期刊论文
[1]机器学习中的特征选择方法研究及展望[J]. 崔鸿雁,徐帅,张利锋,Roy E.Welsch,Berthold K.P.Horn. 北京邮电大学学报. 2018(01)
[2]低秩矩阵近似与优化问题研究进展[J]. 张恒敏,杨健,郑玮. 模式识别与人工智能. 2018(01)
[3]高维小样本分类问题中特征选择研究综述[J]. 王翔,胡学钢. 计算机应用. 2017(09)
[4]Recent Progresses in Deep Learning Based Acoustic Models[J]. Dong Yu,Jinyu Li. IEEE/CAA Journal of Automatica Sinica. 2017(03)
[5]基于卷积神经网络的维吾尔语语音识别[J]. 梁玉龙,屈丹,李真,张文林. 信息工程大学学报. 2017(01)
[6]基于粒子群优化BP神经网络的养肠胃菜谱判定[J]. 张璐,雷雪梅. 计算机科学. 2016(S2)
[7]高维数据的1-范数支持向量机集成特征选择[J]. 鲍捷,杨明,刘会东. 计算机科学与探索. 2012(10)
博士论文
[1]多目标粒子群优化算法的研究[D]. 徐鹤鸣.上海交通大学 2013
硕士论文
[1]基于小样本学习的目标匹配研究[D]. 柳青林.西安电子科技大学 2018
[2]基于统计学的大数据特征分析研究[D]. 徐帅.北京邮电大学 2018
[3]高维小样本数据的特征选择研究及其稳定性分析[D]. 宁永鹏.厦门大学 2014
[4]基于增量聚类和ReliefF的特征选择方法[D]. 童忆莹.西南大学 2011
本文编号:3390391
【文章来源】:江苏大学江苏省
【文章页数】:74 页
【学位级别】:硕士
【部分图文】:
网络新闻用户占网民比例新闻推荐系统在学术领域也受到了越来越多的重视,随着推荐系统愈发深入的
面向小样本的新闻动态推荐模型的研究4基于对特征子集评价标准特征选择方法的核心是对特征子集的评价方法,评价方法的好坏直接影响着特征子集的准确性。这种基于评价方法的特征选择算法与后续的自然语言处理算法是互相独立的,可单独进行训练,常用的特征子集评价方法有Filter模型、Wrapper模型、Embedded模型。目前,Vinyals等人利用数据集训练attention(注意力机制)模型[13],将一个标记的训练集和一个未标记的测试集映射到网络标签中,进行微调以适应新的特征集,来解决one-shotlearning(小样本)问题;柳青林等人在LeCun提出的孪生网络基础上引入迁移学习算法[14],利用YOLOv2算法模型参数,对损失函数进行修改,采取局部放大策略提高算法的性能。目前还提出了K-近邻模型、范数支持向量机、低秩矩阵近似等特征选择方法,这些特征选择方法在特征间冗余处理方面还需进一步研究。信息量爆炸的大数据时代,使得数据成为领域研究重要依据的同时也存在数据特征维度高、特征相关性强的问题,给神经网络领域的发展产生一定的阻碍[15]。良好的特征选择方法能够节省获取原始数据的时间,在自然语言处理方面可以缩减数据存储空间,更快获得数据模型,特征选择能够保留数据的原始特征,使算法具有良好的可解释性。1.2.3新闻推荐研究现状20世纪90年代,随着第一篇基于协同过滤算法的推荐技术论文[16]发表后,研究者开始致力于个性化推荐技术领域的发展。图1.2推荐系统基本工作原理图个性化推荐技术属于信息处理范畴,通过建立用户与数据信息之间的关联关系,依据用户的某种需求向用户推荐出符合用户需要的信息,过滤掉与用户需求无关的信息,最终实现用户的个性化推荐。根据信息和用户之间的关联关系,可将个
面向小样本的新闻动态推荐模型的研究12征权值使得卷积神经网络中的信息误差最校卷积神经网络以卷积层、采样层、池化层为基本网络结构,各网络层之间相互衔接,以多维网络层作为输出端,使训练结果的维度具有灵活性。图2.2卷积神经网络结构卷积神经网络的基本网络结构层:(1)卷积层卷积层的主要工作是将特征向量和卷积核做卷积运算,卷积层又称为特征提取层,如图2.3所示,将一个大小为55的特征向量进行卷积计算,提取特征信息的卷积核大小为33,最终得到计算结果3。图2.3卷积计算原理其中,第三个矩阵中标红的数字3是计算结果,特征向量和卷积核的计算公式如公式2.1所示,将特征向量矩阵中标红的33矩阵与卷积核33矩阵中的对应项进行与运算得到计算结果。特征图的维度与卷积核的维度无关,例如一个nn维的特征矩阵,经过一个mm维的卷积核运算后会得到(nm1)(nm1)维的特征矩阵。假设iC是矩阵第i层的特征值,iC生成过程如公式2.2所示,矩阵第i层的特征值iC的生成公式中,第i层卷积核的权值向量用表示,第i层的偏置量用表示。010101110010=0&1+1&0+0&1+1&0+1&1+0&0+1&1+1&1+0&0=3110110(2.1)
【参考文献】:
期刊论文
[1]机器学习中的特征选择方法研究及展望[J]. 崔鸿雁,徐帅,张利锋,Roy E.Welsch,Berthold K.P.Horn. 北京邮电大学学报. 2018(01)
[2]低秩矩阵近似与优化问题研究进展[J]. 张恒敏,杨健,郑玮. 模式识别与人工智能. 2018(01)
[3]高维小样本分类问题中特征选择研究综述[J]. 王翔,胡学钢. 计算机应用. 2017(09)
[4]Recent Progresses in Deep Learning Based Acoustic Models[J]. Dong Yu,Jinyu Li. IEEE/CAA Journal of Automatica Sinica. 2017(03)
[5]基于卷积神经网络的维吾尔语语音识别[J]. 梁玉龙,屈丹,李真,张文林. 信息工程大学学报. 2017(01)
[6]基于粒子群优化BP神经网络的养肠胃菜谱判定[J]. 张璐,雷雪梅. 计算机科学. 2016(S2)
[7]高维数据的1-范数支持向量机集成特征选择[J]. 鲍捷,杨明,刘会东. 计算机科学与探索. 2012(10)
博士论文
[1]多目标粒子群优化算法的研究[D]. 徐鹤鸣.上海交通大学 2013
硕士论文
[1]基于小样本学习的目标匹配研究[D]. 柳青林.西安电子科技大学 2018
[2]基于统计学的大数据特征分析研究[D]. 徐帅.北京邮电大学 2018
[3]高维小样本数据的特征选择研究及其稳定性分析[D]. 宁永鹏.厦门大学 2014
[4]基于增量聚类和ReliefF的特征选择方法[D]. 童忆莹.西南大学 2011
本文编号:3390391
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3390391.html
最近更新
教材专著