当前位置:主页 > 科技论文 > 自动化论文 >

虚假产品评论在线检测技术研究

发布时间:2020-07-31 13:22
【摘要】:随着互联网时代Web 2.0技术的快速发展,用户已经把产品评论当做网上购物和选择各种产品或服务的重要参考资源。某些商家或个人受利益的驱使故意发表虚假评论,通过招募虚假评论写手来对自身产品或服务进行美化和宣传,或者对竞争对手的产品或服务进行诋毁。虚假评论人群体化的行为危害要比单个虚假评论人大,而且虚假评论人群体特征也要比单个虚假评论人特征要明显。因此,当前对虚假评论作弊检测的主要形式是对虚假评论人群组进行检测。本文提出了一种虚假产品评论在线检测方法。该方法总共有四个阶段。第一阶段,利用时间窗口机制,提取时间窗口内评论数据生成评论人与产品关系的二部图结构,然后对二部图中的评论人与评论人关系进行投影生成评论人图。最后计算评论人图中评论人之间边的权重,并给权重设置一个阈值,保留权重大于等于阈值的边。时间窗口内生成的带权评论人图由于时间窗口机制作用从而变成“动态带权评论人图”。第二阶段,对时间窗口内生成的带权评论人图通过SCAN算法进行图聚类提取候选虚假评论人群组。第三阶段,对候选虚假评论人群组进行欺诈特征计算。第四阶段,使用支持向量机(SVM)对时间窗口内计算的候选虚假评论人群组欺诈特征进行训练建模。实验结果表明,通过在评论数据集上应用本文所提出的虚假产品评论在线检测方法,可以获得较高的精确率和召回率,对虚假评论人群组检测有重要意义。
【学位授予单位】:沈阳理工大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:O157.5;TP18
【图文】:

示意图,时间窗口,机制,滑动时间窗


成一个个时间窗口,则可基于时间窗口进行数据挖掘。逡逑口:特定情况下可以对历史数据进行丢弃,只使用离现围内的数据来进行数据挖掘,这样可以得到一个实时性需要实现滑动时间窗口功能,可以用时间窗口内的时间信息,时间窗口会随着时间的变化实时滑动,丢弃掉最。通过滑动时间窗口从而保留离现在时间点最近的数据间窗口原理逡逑口比较复杂,主要在于相邻时间窗口之间有重叠。如图2口邋w/的时间范围,G到/■/为时间窗口邋w2的时间范围,G到6,此时w2相对w/滑动时间窗口为"到/2,邋iW/到/3,数据挖掘时间窗口必须为滑动时间窗口的整0逡逑t

示意图,社交,示意图,节点


图2.2社交网络示意图逡逑Fig.2.2邋Social邋network邋diagram逡逑观察图2.2可以发现,社交网络中的节点0和节点5相互之间共享了邋4个节点,逡逑即节点0、节点1、节点4和节点5,节点11和节点12相互之间共享了邋2个节点,逡逑即节点11和节点12,通过SCAN算法可以得知这应该属于两种不同的聚类类别。逡逑接下来阐述一下SCAN算法在图结构中的基本概念。设G={V,E丨是一个无逡逑向图,V是无向图G中所有节点的集合,E是无向图G中所有边的集合。下面给逡逑出SCAN算法的一些基本概念:逡逑-14-逡逑

示意图,二部图,示意图


与产品二部图结构逡逑检测领域,有很多使用图结构定义节点信息来对虚huo邋W等人提出了基于二部图投影的虚假评论人群中评论人集合与产品集合的关系产生评论人和产影。本文所提出的虚假产品评论在线检测方法也采构的是时间窗口内的评论数据,而不是整个评论数内的评论数据中,评论人和产品的关系会通过评论在图论中二部图是一种特殊模型。假设有一个无向成两个没有交集的子集,即子集J和子集5,使每节点_/分别属于子集J和子集则可以称无向图G时间窗口内的评论数据中,可以发现一个产品可评论人也可以对多个产品进行评论。如下图3.1所

【相似文献】

相关期刊论文 前1条

1 吕海;王琢;;在线产品虚假评论检测技术研究[J];沈阳理工大学学报;2018年06期

相关硕士学位论文 前2条

1 吕海;虚假产品评论在线检测技术研究[D];沈阳理工大学;2019年

2 侯婷婷;基于二部图投影的虚假评论人群组检测算法研究[D];沈阳理工大学;2016年



本文编号:2776530

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2776530.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户cf50f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com