面向商品的虚假评论检测技术研究
发布时间:2024-04-12 00:52
随着电子商务的飞速发展,线上购物产生的商品评论对消费者选择商品提供了重要的参考价值。然而受利益的驱使,某些商家会雇佣评论者对商品属性进行失实说明,使消费者收到外界对商品质量的错误反馈,进而影响消费者的消费行为。虚假评论能够影响商家口碑,使消费者在商家的选择上具有倾向性。因此不法商家对虚假评论有着迫切需求,从而导致虚假评论日益泛滥,破坏了电子商务市场应该遵循的良性竞争规则。因此虚假评论检测研究已经成为电子商务良性发展过程中极为重要的工作之一。目前研究者通常对评论文本和评论者行为进行分析来检测虚假评论,而很少有人以商户特征、评论者的历史行为以及评论时间为依据分析评论的异常性。因此以往的方法只能检测出隐藏性较低的虚假评论,而对专业的虚假评论者撰写的隐藏性较高的虚假评论检测准确率较低。为解决这些问题,给消费者购物提供更加准确的参考,本文主要进行了以下两方面的工作:(1)提出了一种基于习惯偏差与XGBoost算法的虚假评论检测方法。首先,提出一种改进的情感极性计算算法,并根据位置因素加入本地化情感词,使评论文本情感极性的计算更为精准;其次,提出了商家的异常波动区间概念以及评论用户习惯偏差指标并融...
【文章页数】:61 页
【学位级别】:硕士
【部分图文】:
本文编号:3951408
【文章页数】:61 页
【学位级别】:硕士
【部分图文】:
图3-2某位评论者评论情感—评分图
面向商品的虚假评论检测技术研究-5所示:2_115()nncurrentreviewjjF其中,为评论的情感—评分的相符程度,j为当前评论用户的第j条历史评为评分满分,故的计算公式如3-6所示:这里取出某位评论者的全部评论绘制了情感—评分....
图3-3某位评论者评论长度图
图3-3某位评论者评论长度图由图可知,大部分评论长度都在一定范围内波动,有小部分的评论长度是偏过大的,这也许是由于某些评论者会被利益驱使进行虚假评论的发布,如果长度和历史评论长度的方差过大,则认为此用户存在撰写虚假评论的可能,为此条评论为潜在的虚假评论。三、商户异常波动某些商....
图3-4店铺人流量和EMA曲线对比图
面向商品的虚假评论检测技术研究(3-为了便于理解,这里对一家店铺三年的所有评论进行了人流量的计算,设定为一个记录时间区间,该店铺的人流量波动如图3-4所示:1,0.370,0.3iiiiiixYxFxYx
图3-5店铺平均评分和EMA曲线对比图
图3-5店铺平均评分和EMA曲线对比图3.2.4基于XGBoost算法的虚假评论检测在得到特征模型之后,使用XGBoost算法进行虚假评论的检测工作,下面绍该算法的检测流程:(1)假设有文本数据集R={x1,x2,…,xn},其中xi代表第i条评论。每条....
本文编号:3951408
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3951408.html