垃圾评论检测算法的研究
发布时间:2017-05-20 09:09
本文关键词:垃圾评论检测算法的研究,由笔耕文化传播整理发布。
【摘要】:在电子商务平台上垃圾评论已经严重影响到消费者的用户体验和切身利益,如何检测垃圾评论成为当前研究的热点。垃圾评论可以分为内容型垃圾评论和欺诈型评论,内容型垃圾评论通常为了达到消息传播的目的,欺诈型评论的目的在于改变潜在消费者对商品的印象。本文通过分析垃圾评论的表现形式,分别针对内容型垃圾评论和欺诈型评论进行分析和检测。内容型垃圾评论通常在评论内容中添加广告链接、垃圾网页链接和黄赌毒等,其目的在于信息的推送和病毒的传播等。本文通过研究内容型垃圾评论的表现形式,分析内容型垃圾评论的特征,设计BP神经网络模型和自编码神经网络与朴素贝叶斯的结合模型对内容型垃圾评论进行检测。欺诈型垃圾评论是指评论发布者通过虚假的发货和虚假的订单获取大量的评论权限,蓄意吹捧和诋毁特定对象的形象,达到改变潜在消费者购买行为的虚假评论。欺诈型评论直接影响到消费者的购买决定,损害消费者对商品的知情权。本文通过分析欺诈型评论发布者表现形式,设计了基于多元特征的欺诈型评论检测模型。其中多元特征包含用户行为特征、商品特征、用户自身属性特征和评论内容特征。根据研究表明评论发布者行为特征对欺诈型评论检测贡献较大,然而当前在用户行为特征提取中掺杂过多的人工参与,本文使用栈式自编码神经网络对用户行为特征进行自动学习,减少特征提取中的人工参与,致力于学习更全面的用户行为特征,然后本文使用多元特征对欺诈型评论进行检测。
【关键词】:垃圾评论检测 自编码神经网络 栈式自编码神经网络 特征学习
【学位授予单位】:西南交通大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP391.1
【目录】:
- 摘要6-7
- Abstract7-11
- 第1章 绪论11-15
- 1.1 课题研究背景及意义11
- 1.2 国内外研究现状11-13
- 1.3 研究内容和目标13
- 1.4 论文结构安排13-15
- 第2章 垃圾评论检测相关技术和算法15-27
- 2.1 垃圾评论检测技术15-18
- 2.1.1 内容型垃圾评论检测技术15-17
- 2.1.2 欺诈型垃圾评论检测技术17-18
- 2.2 垃圾评论检测算法优缺点18-19
- 2.3 人工神经网络19-24
- 2.3.1 感知器模型19-21
- 2.3.2 BP神经网络21-22
- 2.3.3 梯度下降算法22-24
- 2.4 栈式自编码神经网络24-26
- 2.4.1 自编码神经网络25
- 2.4.2 自编码神经网络的PCA应用25-26
- 2.4.3 稀疏自编码神经网络26
- 2.5 本章小结26-27
- 第3章 垃圾评论检测框架设计与数据预处理27-34
- 3.1 垃圾评论检测总体框架27-28
- 3.2 垃圾评论数据集28-29
- 3.2.1 其他数据集29
- 3.3 数据集的准备29-33
- 3.3.1 数据预处理30-32
- 3.3.2 垃圾评论检测数据集32-33
- 3.4 本章小结33-34
- 第4章 内容型垃圾评论检测34-48
- 4.1 内容型垃圾评论的表现手段34-35
- 4.2 特征选择与分析35-38
- 4.2.1 评论元数据相关的特征35
- 4.2.2 评论内容相关的特征35-38
- 4.2.3 评论发布者相关的特征38
- 4.3 内容型垃圾评论检测算法分析与设计38-42
- 4.3.1 基于BP神经网络内容垃圾评论检测模型38-39
- 4.3.2 自编码神经网络与朴素贝叶斯结合模型39-42
- 4.4 实验结果与分析42-47
- 4.4.1 数据归一化42-43
- 4.4.2 基于BP神经网络的检测模型实验结果43
- 4.4.3 自编码神经网络与朴素贝叶斯结合模型实验结果43-46
- 4.4.4 实验对比分析46-47
- 4.5 本章小结47-48
- 第5章 欺诈型评论检测48-61
- 5.1 欺诈型评论的作弊手段48-49
- 5.2 欺诈型评论的检测原理分析49
- 5.3 基于多元特征的欺诈型评论检测模型49-56
- 5.3.1 欺诈型评论检测框架50
- 5.3.2 评论内容、用户和商品的特征选择50-52
- 5.3.3 用户行为特征的学习模型52-56
- 5.4 欺诈评论检测实验对比与分析56-60
- 5.4.1 数据归一化56
- 5.4.2 实验结果分析56-59
- 5.4.3 实验对比59-60
- 5.5 本章小结60-61
- 第6章 总结与展望61-63
- 6.1 总结61
- 6.2 不足与展望61-63
- 致谢63-64
- 参考文献64-68
- 攻读硕士学位期间发表的论文68
【参考文献】
中国期刊全文数据库 前1条
1 杨铭;祁巍;闫相斌;李一军;;在线商品评论的效用分析研究[J];管理科学学报;2012年05期
本文关键词:垃圾评论检测算法的研究,由笔耕文化传播整理发布。
,本文编号:381172
本文链接:https://www.wllwen.com/wenyilunwen/guanggaoshejilunwen/381172.html