基于文本与用户行为挖掘的虚假评论识别研究
发布时间:2020-04-23 15:54
【摘要】:在电子商务网站中消费者对某一商品或商家进行的在线评论通常是决定消费者购买某一产品或服务的关键性因素之一。一些不良商家出自于自身的利益去操控这些在线评论,所形成的大量虚假评论影响了消费者的利益和电子商务的正常发展。因此检测这些虚假评论成为了一项重要的任务。本文提出了一种基于文本与用户行为挖掘的方法对虚假评论进行了识别。本文主要完成了以下工作:(1)提取了有效的虚假评论识别特征。通过分析评论的文本及其语义提取了n-gram特征、词性特征和LDA主题特征;通过分析用户的异常行为和评论、评论者、商家之间的潜在关系提取了最大内容相似度、积极评论比例、最大日评论数目、评分偏差、评分、评论文本长度、评论者频繁度和目标项相似度等特征。(2)构建了虚假评论检测模型。基于提取的特征分别构建了评论文本特征指标、评论语义特征指标、用户行为特征指标和关系特征指标等四类指标并基于SVM和XGboost分类算法构建了分类模型。(3)对模型进行了实证分析。分别设计了基于评论文本特征指标、基于评论语义特征指标、基于用户行为特征指标、基于关系特征指标和基于融合特征指标的五类分类实验。最终通过实验验证了选取特征的合理性与构建模型的有效性。本文关于虚假评论识别的研究结果,为虚假评论识别研究提供了一些新的思路与有效的识别方法,可以为虚假评论识别实践工作提供一定的理论支持。
【图文】:
17图 3.2 Yelp 网站一条评论实例Figure 3.2 An example of a review on the Yelp website作为美国最大点评网站,Yelp 网站为了确保发布在 Yelp 上的用户评论的可信度,它使过滤算法过滤网站中假的或者可疑的评论,并将它们列入过滤列表中。根据 Yelp 首席执行Jeremy Stoppelman 的说法,Yelp 的过滤算法已经很成熟。自 2005 年推出以来,Yelp 一直过滤虚假评论。Yelp 也有足够的信心将其过滤后的评论公开[12]。但由于商业机密不能把算公开。因此在本研究中使用了 Mukherjee 等[12]提供的部分 Yelp 数据集,把 Yelp 中过滤掉的据视为虚假评论,把未过滤掉的数据视为真实的评论,,从而获得有标注的数据集。
内蒙古大学硕士学位论文各个商户的简要介绍以及网友的点评、点评者给出的星级评分等内容。以下图 3.1 和图 3.2 Yelp 网站的封面截图和 Yelp 网站中某个用户对某家餐厅的一次评论。
【学位授予单位】:内蒙古大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:F713.36
本文编号:2637899
【图文】:
17图 3.2 Yelp 网站一条评论实例Figure 3.2 An example of a review on the Yelp website作为美国最大点评网站,Yelp 网站为了确保发布在 Yelp 上的用户评论的可信度,它使过滤算法过滤网站中假的或者可疑的评论,并将它们列入过滤列表中。根据 Yelp 首席执行Jeremy Stoppelman 的说法,Yelp 的过滤算法已经很成熟。自 2005 年推出以来,Yelp 一直过滤虚假评论。Yelp 也有足够的信心将其过滤后的评论公开[12]。但由于商业机密不能把算公开。因此在本研究中使用了 Mukherjee 等[12]提供的部分 Yelp 数据集,把 Yelp 中过滤掉的据视为虚假评论,把未过滤掉的数据视为真实的评论,,从而获得有标注的数据集。
内蒙古大学硕士学位论文各个商户的简要介绍以及网友的点评、点评者给出的星级评分等内容。以下图 3.1 和图 3.2 Yelp 网站的封面截图和 Yelp 网站中某个用户对某家餐厅的一次评论。
【学位授予单位】:内蒙古大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:F713.36
【参考文献】
相关期刊论文 前1条
1 邹晓辉;孙静;;LDA主题模型[J];智能计算机与应用;2014年05期
相关硕士学位论文 前7条
1 郭一方;LBSN中虚假评论群体检测[D];东南大学;2017年
2 李静;基于卷积神经网络的虚假评论识别技术的研究[D];北京邮电大学;2017年
3 侯婷婷;基于二部图投影的虚假评论人群组检测算法研究[D];沈阳理工大学;2016年
4 宋大为;基于图聚类的虚假评论人群组检测算法研究[D];沈阳理工大学;2016年
5 李准;基于评论特征的虚假评论者检测[D];沈阳理工大学;2015年
6 宋海霞;融合内容及行为的虚假评论检测方法研究[D];昆明理工大学;2014年
7 辛竹;文本分类中的特征提取算法研究与改进[D];北京邮电大学;2014年
本文编号:2637899
本文链接:https://www.wllwen.com/jingjilunwen/guojimaoyilunwen/2637899.html