当前位置:主页 > 经济论文 > 国际贸易论文 >

基于知识图谱的虚假评论检测方法研究

发布时间:2020-03-21 03:19
【摘要】:目前,电子商务在日常生活中扮演着非常重要的角色。而在线评论在电子商务应用中起着至关重要的作用,它帮助人们比较产品的质量、评估商店的服务,并作为消费者购买决策的依据。但是,由于利益的驱动,商家开始雇佣水军冒充普通顾客伪造评论,试图通过虚假的评论来误导消费者。一方面对自己的商品进行好评,另一方面对于竞争者恶意诋毁。虚假评论的存在,使营造公平公正的网络购物环境带来了巨大挑战。因此,如何有效识别虚假评论成为亟待解决的网络安全问题之一。许多工作者专注于研究虚假评论的检测方法,所研究的成果在帮助用户提供合理购物决策同时对商家良性竞争有指导意义。尽管研究人员对虚假评论检测取得了很大进展,但依旧存在很多不足之处。首先,研究成果没有挖掘评论文本的多维特征以及与评分之间的一致性问题;其次,忽略了评论数量及评分与时间序列存在隐含关系;最后,没有考虑多模网络特征对识别虚假评论的影响。所以,目前的研究算法对虚假评论的识别仍旧存在很大问题。针对以上对虚假评论检测存在的问题,本文提出并深入研究一种基于知识图谱的虚假评论检测方法。本文主要工作如下:(1)提出一种基于评分-文本一致性的虚假评检测方法。首先,分析评论文本的情感极性,考虑情感强度、特征影响度对文本极性的影响,并判断文本极性与评分的一致性;其次,通过分析多源特征简化特征集,进而提取5个重要的虚假评论检测特征;最后,融合抽取的多个虚假评论特征,构建出虚假评论检测分类器。该方法是计算知识图谱中评论真实性的重要前提。(2)提出一种基于多维时间序列的虚假评论识别方法。首先,在评分和评论数量两个维度上,借助于贝叶斯算法,拟合一条曲线时间序列曲线;其次,设置滑动时间窗口并使用模板匹配算法检测拟合曲线突发模式;最后,比较突发时间段的评分与评论数量的一致性。该方法是根据评论数量及评分突然上升或下降的特点提出的,不但能高效率的检测虚假评论而且有效的检测商铺刷单问题。(3)提出一种基于动态知识图谱的虚假评论检测方法。首先,构建了多粒度双向LSTM(ST-BLSTM)网络模型,用以抽取包含评论者、评论、商品和店铺的四类实体;其次,定义了实体间的关系度量并探讨了四类实体之间的联系;然后,考虑了时间因素对虚假评论的影响,设计了一个迭代模型,在关系抽取中加入时间特征,构建动态图谱网络;最后,定义4个新指标,以有效衡量四类节点间的相互影响关系,并据此构建出虚假评论检测分类器。此外,为支持本文的创新性,本文利用八爪鱼数据器采集了大量多特征评论数据集。该数据集弥补了当前数据单模且信息不完善的缺点。该数据集包含用户、评论、商品、店铺以及评论时间等多模特征信息。数据采集过程主要步骤如下:首先,通过目前虚假评论特点和查找文献,检验本文采集信息源的合理性;再次,针对原始数据进行标准化并进行多模特征相关性分析;最后,验证多模特征信息对在虚假评论检测的重要性。
【图文】:

研究思路


些多维特征的权重比例,解决了不同特征的融合问题短期偏好。在 Movielens 数据集上的对比实验验证文有效提高推荐的 MAP 值。据构建病历图谱,有助于与开放知识库关联,,进行疾研究。针对目前常见的几种基于关系数据库的 RDF 存性能不足等问题,Xia[26]提出了一种改进的病历图谱以及基于类型的存储方案的对比 验证了该方案的有中的情况下具有更高的查询效率。推荐和医疗系统应用比较成熟,很多研究者们做了大是目前把知识图谱应用于虚假评论的检测几乎没人做图谱的虚假评论检测方法。安排及研究工作究思路如图 1-1 形式。

特征选择


次判断增加或者删除某个变量是否对因变量有显著影响, ¢( ) ¢( ) 2 中: ¢( )表示不包含检验变量时模型的对数似然值, ,近似服从自由度为待检验因素个数的 分布。当大于设,表示该影响因素对 Logistic 模型有意义。本文计算 7 05 条件下,计算结果如表 2-5 所示。结果可以看出在 5 个。因此得出其中一个变量在其他 4 个变量不变的情况下影对检测虚假评论非常有意义。表 2-4 特征贡献率F1 F2 F3 F4 F5 59357 0.448040 0.156428 0.056471 0.103679 0.0表 2-5 似然比测试表征 F0 F1 F2 F3 F4 F5 F66.8 9.4 6.2 4.3 5.2 3.8 3.
【学位授予单位】:山东师范大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:F713.36;TP391.1

【相似文献】

相关期刊论文 前10条

1 饶鲜;杨绍全;魏青;董春曦;;基于熵的入侵检测特征参数选择[J];系统工程与电子技术;2006年04期

2 龙啸;方勇;黄诚;刘亮;;Webshell研究综述:检测与逃逸之间的博弈[J];网络空间安全;2018年01期

3 沈通;吴志军;张建富;杨建新;曾龙;;数控加工原位检测系统中检测规划关键技术研究[J];制造技术与机床;2018年08期

4 张少擎;;基于MBD的数字化零件检测技术研究[J];航空制造技术;2014年21期

5 王通;郭渊博;祝松帅;严新成;;基于大数据的APT威胁检测方法[J];信息工程大学学报;2017年06期

6 刘素芳,凌云,曹致刚,程玉香,姜雪波,曾蓉嘉,陈雪莲,贾铭章;全自动酶标分析系统对抗-HCVEIA检测特征性的影响[J];中国输血杂志;2000年01期

7 周颖;胡勇;;基于关联分析的Webshell检测方法研究[J];信息安全研究;2018年03期

8 欧凡;刘冲;;人脸图像灰度分布统计分析与检测特征设计[J];大连理工大学学报;2010年04期

9 申家全;闫怀志;胡昌振;;探地雷达目标检测中的离散余弦变换方法[J];仪器仪表学报;2011年06期

10 刘丽冰;桑宏强;陈英姝;张红梅;田大伟;;用于加工中心的在线检测新方法研究[J];新技术新工艺;2005年11期

相关会议论文 前1条

1 侯长军;彭承琳;罗伟;霍丹群;段玉娟;罗小刚;法焕宝;;卟啉传感的肺病早期诊断技术研究[A];中国仪器仪表学会医疗仪器分会第四次全国会员代表大会暨2009年学术年会论文集[C];2009年

相关重要报纸文章 前2条

1 ;如何解决误报率问题[N];中国计算机报;2002年

2 本报记者 耿挺;两小时让H7N9原形毕露[N];上海科技报;2013年

相关博士学位论文 前3条

1 张治国;前方道路行人检测和距离估计研究[D];华中科技大学;2017年

2 许舟军;基于异常分析的入侵检测关键技术研究[D];天津大学;2006年

3 滕少华;基于对象监控的分布式协同入侵检测[D];广东工业大学;2008年

相关硕士学位论文 前10条

1 李昭青;基于视频的行人检测研究[D];山东大学;2019年

2 吴楚婷;基于用户网络数据指纹的异常行为检测研究[D];北京邮电大学;2019年

3 房有丽;基于知识图谱的虚假评论检测方法研究[D];山东师范大学;2019年

4 毛科栋;基于深度学习的房颤检测[D];浙江工业大学;2019年

5 李承前;基于深度学习的行人检测方法的研究[D];中国石油大学(华东);2017年

6 高苗;基于姿态分析的摔倒检测研究与实现[D];上海师范大学;2019年

7 刘广峰;基于车载摄像头的行人检测算法研究[D];吉林大学;2018年

8 刘清波;基于深度学习的行人检测研究[D];湖南大学;2018年

9 苏博文;基于HOG3D的三维CT腹部器官检测[D];哈尔滨工业大学;2018年

10 刘李正;基于Kinect的人体跌倒检测算法研究[D];南京邮电大学;2018年



本文编号:2592658

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/guojimaoyilunwen/2592658.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户a5aa4***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com