基于深度学习的虚假评论检测
发布时间:2021-01-31 04:08
随着互联网的迅速发展,网上购物以其方便快捷的优势代替了实体店购物,已成为时下最流行的消费方式。出于谋利的目的,电商平台中出现越来越多的虚假评论,这在一定程度上误导消费者的购买趋向,致使消费者买到的商品与描述不符,逐渐丧失对电商平台的信任。为了净化电商环境,研究学者通过提取评论文本和评论者的各项特征并利用传统分类器进行虚假评论检测,虽然这类方法取得了一定的成果,但是提取特征的过程中依赖于专家知识,而且没有考虑相关产品的特征,不具有广泛应用性。虚假评论一般会比真实评论使用更多情感词描述目标产品的特征,针对不同的目标产品,虚假评论者会对不同的特征进行描述,为了使得检测方法适用于不同领域,本文利用产品的相关特征,结合深度学习方法提出了两种虚假评论检测模型。第一种是融合产品相关特征的虚假评论检测方法,该方法将产品相关特征与评论文本组合,以此作为输入来训练卷积神经网络模型实现虚假评论检测,最后将该算法与两个有效的传统分类器组合,降低了过拟合问题,提高检测准确率。第二种是基于FastText的虚假评论检测方法,该方法首先使用语料库训练Word2Vec模型,基于该模型扩充了产品特征词汇集,并建立文本向...
【文章来源】:山东科技大学山东省
【文章页数】:57 页
【学位级别】:硕士
【部分图文】:
图2.1网络爬虫流程图??Fig.?2.1?The?flow?chart?of?web?crawler??
的有监督学习算法[23]。人工神经网络一般具有多个网络层来处理数据,每层网络??又有多个节点,层与层之间的节点通过权值相互连接,这些节点被称为神经元,??权值代表连接的重要程度,神经元的基本结构如图2.2所示:??0??图2.2神经元结构??Fig.?2.2?Neuronal?structure??图2.2中,Xp?x2,...,表示从其他神经兀传入的《个输入值,wQ,vi],…,??w?表示输入的权重,即连接的重要程度,0表示偏置,神经元i的输出兄可以通过??公式2-1求得:??yrf(Yuwixj-0)?(2-i)??其中,/表示激活函数,用来对数据引入非线性因素,使其可以处理更加复杂??的问题,学术研究中经常使用的激活函数有多种,比如sigmoid函数、tanh函数等,??在实际应用中,需要根据具体问题选择合适的激活函数。??10??
规则相互连接。一个典型的神经网络包含输入层、隐藏层、输出层,分别用来负??责不同的数据操作,一般来说,输入层用来读取原始的数据,隐藏层用来对数据??进行计算处理,输出层用来将处理后的结果输出,结构如图2.3所7K。??输入层?隐含层?输出层??图2.3典型的神经网络结构??Fig.?2.3?Typical?neural?network?structure??在搭建好模型结构之后首先需要使用标注好的数据对模型进行反复训练,使其??不断迭代调整各项参数,直到变得非常智能,每次训练需要经过两个过程:前向??传播、反向传播[24]。在前向传播过程中,数据通过输入层进入网络,在隐藏层进??行复杂的数据处理,网络模型的计算结果被整合至输出层并输出。在反向传播过??程中,模型首先根据一定的损失函数计算所有样本的输出值与实际标注值的误差??之和,然后把该值从输出层传播到输入层,同时更新权值参数。在神经网络的训??练过程中,需要使用大量己标注的数据集执行多次正向传播和反向传播的过程,??反复调整网络参数
【参考文献】:
期刊论文
[1]一种基于启发式规则的半监督垃圾评论分类方法[J]. 张鹏,王素格,李德玉,王杰. 山东大学学报(理学版). 2017(07)
[2]大数据与深度学习综述[J]. 马世龙,乌尼日其其格,李小平. 智能系统学报. 2016(06)
[3]大数据分析的神经网络方法[J]. 章毅,郭泉,王建勇. 工程科学与技术. 2017(01)
[4]基于Word2vec的微博短文本分类研究[J]. 张谦,高章敏,刘嘉勇. 信息网络安全. 2017(01)
[5]卷积神经网络研究综述[J]. 李彦冬,郝宗波,雷航. 计算机应用. 2016(09)
[6]基于融合特征的虚假评论检测方法[J]. 张考,于洪涛,崔瑞飞. 信息工程大学学报. 2016(04)
[7]融合Word2vec与TextRank的关键词抽取研究[J]. 宁建飞,刘降珍. 现代图书情报技术. 2016(06)
[8]图像理解中的卷积神经网络[J]. 常亮,邓小明,周明全,武仲科,袁野,杨硕,王宏安. 自动化学报. 2016(09)
[9]基于情感特征和用户关系的虚假评论者的识别[J]. 邵珠峰,姬东鸿. 计算机应用与软件. 2016(05)
[10]融合情感极性和逻辑回归的虚假评论检测方法[J]. 赵军,王红. 智能系统学报. 2016(03)
硕士论文
[1]基于微博的用户职业抽取研究[D]. 吕霞.中国科学技术大学 2017
[2]基于深度神经网络的微博短文本情感分析研究[D]. 张英.中原工学院 2017
[3]基于改进卷积神经网络算法的研究与应用[D]. 王飞飞.南京邮电大学 2016
[4]基于卷积神经网络的图像分类方法研究[D]. 朱芸芸.北京交通大学 2016
[5]基于卷积神经网络的短文本分类方法研究[D]. 蔡慧苹.西南大学 2016
[6]基于图聚类的虚假评论人群组检测算法研究[D]. 宋大为.沈阳理工大学 2016
[7]基于卷积神经网络的图像分类技术研究[D]. 楚敏南.湘潭大学 2015
[8]基于评论特征的虚假评论者检测[D]. 李准.沈阳理工大学 2015
[9]基于Word2Vec主题提取的微博推荐[D]. 朱雪梅.北京理工大学 2014
[10]基于深度学习的欺骗性垃圾信息识别研究[D]. 景亚鹏.华东师范大学 2014
本文编号:3010180
【文章来源】:山东科技大学山东省
【文章页数】:57 页
【学位级别】:硕士
【部分图文】:
图2.1网络爬虫流程图??Fig.?2.1?The?flow?chart?of?web?crawler??
的有监督学习算法[23]。人工神经网络一般具有多个网络层来处理数据,每层网络??又有多个节点,层与层之间的节点通过权值相互连接,这些节点被称为神经元,??权值代表连接的重要程度,神经元的基本结构如图2.2所示:??0??图2.2神经元结构??Fig.?2.2?Neuronal?structure??图2.2中,Xp?x2,...,表示从其他神经兀传入的《个输入值,wQ,vi],…,??w?表示输入的权重,即连接的重要程度,0表示偏置,神经元i的输出兄可以通过??公式2-1求得:??yrf(Yuwixj-0)?(2-i)??其中,/表示激活函数,用来对数据引入非线性因素,使其可以处理更加复杂??的问题,学术研究中经常使用的激活函数有多种,比如sigmoid函数、tanh函数等,??在实际应用中,需要根据具体问题选择合适的激活函数。??10??
规则相互连接。一个典型的神经网络包含输入层、隐藏层、输出层,分别用来负??责不同的数据操作,一般来说,输入层用来读取原始的数据,隐藏层用来对数据??进行计算处理,输出层用来将处理后的结果输出,结构如图2.3所7K。??输入层?隐含层?输出层??图2.3典型的神经网络结构??Fig.?2.3?Typical?neural?network?structure??在搭建好模型结构之后首先需要使用标注好的数据对模型进行反复训练,使其??不断迭代调整各项参数,直到变得非常智能,每次训练需要经过两个过程:前向??传播、反向传播[24]。在前向传播过程中,数据通过输入层进入网络,在隐藏层进??行复杂的数据处理,网络模型的计算结果被整合至输出层并输出。在反向传播过??程中,模型首先根据一定的损失函数计算所有样本的输出值与实际标注值的误差??之和,然后把该值从输出层传播到输入层,同时更新权值参数。在神经网络的训??练过程中,需要使用大量己标注的数据集执行多次正向传播和反向传播的过程,??反复调整网络参数
【参考文献】:
期刊论文
[1]一种基于启发式规则的半监督垃圾评论分类方法[J]. 张鹏,王素格,李德玉,王杰. 山东大学学报(理学版). 2017(07)
[2]大数据与深度学习综述[J]. 马世龙,乌尼日其其格,李小平. 智能系统学报. 2016(06)
[3]大数据分析的神经网络方法[J]. 章毅,郭泉,王建勇. 工程科学与技术. 2017(01)
[4]基于Word2vec的微博短文本分类研究[J]. 张谦,高章敏,刘嘉勇. 信息网络安全. 2017(01)
[5]卷积神经网络研究综述[J]. 李彦冬,郝宗波,雷航. 计算机应用. 2016(09)
[6]基于融合特征的虚假评论检测方法[J]. 张考,于洪涛,崔瑞飞. 信息工程大学学报. 2016(04)
[7]融合Word2vec与TextRank的关键词抽取研究[J]. 宁建飞,刘降珍. 现代图书情报技术. 2016(06)
[8]图像理解中的卷积神经网络[J]. 常亮,邓小明,周明全,武仲科,袁野,杨硕,王宏安. 自动化学报. 2016(09)
[9]基于情感特征和用户关系的虚假评论者的识别[J]. 邵珠峰,姬东鸿. 计算机应用与软件. 2016(05)
[10]融合情感极性和逻辑回归的虚假评论检测方法[J]. 赵军,王红. 智能系统学报. 2016(03)
硕士论文
[1]基于微博的用户职业抽取研究[D]. 吕霞.中国科学技术大学 2017
[2]基于深度神经网络的微博短文本情感分析研究[D]. 张英.中原工学院 2017
[3]基于改进卷积神经网络算法的研究与应用[D]. 王飞飞.南京邮电大学 2016
[4]基于卷积神经网络的图像分类方法研究[D]. 朱芸芸.北京交通大学 2016
[5]基于卷积神经网络的短文本分类方法研究[D]. 蔡慧苹.西南大学 2016
[6]基于图聚类的虚假评论人群组检测算法研究[D]. 宋大为.沈阳理工大学 2016
[7]基于卷积神经网络的图像分类技术研究[D]. 楚敏南.湘潭大学 2015
[8]基于评论特征的虚假评论者检测[D]. 李准.沈阳理工大学 2015
[9]基于Word2Vec主题提取的微博推荐[D]. 朱雪梅.北京理工大学 2014
[10]基于深度学习的欺骗性垃圾信息识别研究[D]. 景亚鹏.华东师范大学 2014
本文编号:3010180
本文链接:https://www.wllwen.com/jingjilunwen/guojimaoyilunwen/3010180.html