基于半监督学习的虚假评论识别研究
发布时间:2021-04-08 16:18
近年来,随着网络购物的发展,消费者逐渐由传统的线下购物转向更便捷的线上购物,且养成了对已购买商品发布评论的习惯。电子商务平台上逐渐积累了大量的在线商品评论,这些评论信息为商家,潜在消费者和研究者们提供了珍贵的数据资源。由于在线评论信息可以在某种程度上影响消费者的购物决策,进而影响产品销量,因此在商品评论中逐渐出现了一些不真实的内容。这些虚假评论迷惑了消费者,降低了在线评论的参考价值,扰乱了正常的电商秩序,因此识别虚假评论显得尤为重要。在线商品评论是最具有代表意义的评论信息,是虚假评论识别问题的理想数据源,也是本文使用的数据集。本文对虚假评论识别技术和半监督学习方法进行了研究与分析,首先介绍了虚假评论识别问题的研究现状和发展趋势,然后介绍了半监督学习原理及其分类方法,最后将基于分歧的半监督学习领域的三个主流算法:协同训练(Co-Training)算法,三体训练法(Tri-Training)算法和协同随机森林(Co-Forest)算法应用到了虚假评论识别任务中,提出了基于半监督学习的虚假评论识别模型。本文围绕在线商品评论数据,基于分歧的半监督学习,虚假评论识别问题等关键问题展开研究,主要的...
【文章来源】:南京财经大学江苏省
【文章页数】:68 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 研究背景及研究意义
1.1.1 研究背景
1.1.2 研究意义
1.2 国内外研究现状
1.2.1 虚假评论识别研究现状
1.2.2 半监督学习研究现状
1.2.3 小结
1.3 研究内容和创新点
1.3.1 研究内容
1.3.2 技术路线和创新点
第二章 虚假评论识别和半监督学习相关理论
2.1 虚假评论识别相关理论
2.1.1 虚假评论介绍
2.1.2 虚假评论识别方法
2.2 半监督学习相关理论
2.2.1 半监督学习原理
2.2.2 半监督学习分类
2.3 本章小结
第三章 数据预处理和特征构建
3.1 数据描述
3.1.1 获取源数据
3.1.2 分布分析
3.2 训练集构建
3.2.1 重复评论
3.2.2 数据标注
3.3 特征构建
3.3.1 特征概述
3.3.2 特征集合
3.4 本章小结
第四章 基于半监督学习的虚假评论识别方法
4.1 基于CO-TRAINING算法的虚假评论识别模型
4.1.1 CO-TRAINING算法
4.1.2 基于CO-TRAINING算法的虚假评论识别算法
4.2 基于TRI-TRAINING算法的虚假评论识别模型
4.2.1 TRI-TRAINING算法
4.2.2 基于TRI-TRAINING算法的虚假评论识别算法
4.3 基于CO-FOREST算法的虚假评论识别模型
4.3.1 CO-FOREST算法
4.3.2 基于CO-FOREST算法的虚假评论识别模型
4.4 本章小结
第五章 实验结果与分析
5.1 实验平台与评价指标
5.2 基于全监督框架的最优特征选择
5.2.1 全监督框架
5.2.2 特征实验结果
5.3 基于半监督学习的虚假评论识别模型实验结果分析
5.3.1 基于不同半监督学习算法的实验设计与结果分析
5.3.2 标注数据比例和参数敏感性的实验结果分析
5.4 本章小结
第六章 结论与展望
6.1 研究结论
6.2 研究展望
参考文献
攻读硕士学位期间发表的论文
后记
【参考文献】:
期刊论文
[1]基于DDAG-SVM的在线商品评论可信度分类模型[J]. 陈燕方. 情报理论与实践. 2017(07)
[2]一种基于启发式规则的半监督垃圾评论分类方法[J]. 张鹏,王素格,李德玉,王杰. 山东大学学报(理学版). 2017(07)
[3]在线商品虚假评论关键问题研究综述[J]. 朱娟. 现代情报. 2017(05)
[4]基于SVM分类模型的垃圾文本识别研究[J]. 黄正伟,唐芳艳. 数学的实践与认识. 2016(07)
[5]一种用于微博谣言检测的半监督学习算法[J]. 路同强,石冰,闫中敏,周珮. 计算机应用研究. 2016(03)
[6]基于特征表现的虚假评论人预测研究[J]. 聂卉,吴毅骏. 图书情报工作. 2015(10)
[7]基于随机森林的产品垃圾评论识别[J]. 何珑. 中文信息学报. 2015(03)
[8]基于PU学习算法的虚假评论识别研究[J]. 任亚峰,姬东鸿,张红斌,尹兰. 计算机研究与发展. 2015(03)
[9]在线商品虚假评论形成路径研究[J]. 陈燕方,娄策群. 现代情报. 2015(01)
[10]电子商务中垃圾评论检测的特征提取方法[J]. 游贵荣,吴为,钱沄涛. 现代图书情报技术. 2014(10)
本文编号:3125861
【文章来源】:南京财经大学江苏省
【文章页数】:68 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 研究背景及研究意义
1.1.1 研究背景
1.1.2 研究意义
1.2 国内外研究现状
1.2.1 虚假评论识别研究现状
1.2.2 半监督学习研究现状
1.2.3 小结
1.3 研究内容和创新点
1.3.1 研究内容
1.3.2 技术路线和创新点
第二章 虚假评论识别和半监督学习相关理论
2.1 虚假评论识别相关理论
2.1.1 虚假评论介绍
2.1.2 虚假评论识别方法
2.2 半监督学习相关理论
2.2.1 半监督学习原理
2.2.2 半监督学习分类
2.3 本章小结
第三章 数据预处理和特征构建
3.1 数据描述
3.1.1 获取源数据
3.1.2 分布分析
3.2 训练集构建
3.2.1 重复评论
3.2.2 数据标注
3.3 特征构建
3.3.1 特征概述
3.3.2 特征集合
3.4 本章小结
第四章 基于半监督学习的虚假评论识别方法
4.1 基于CO-TRAINING算法的虚假评论识别模型
4.1.1 CO-TRAINING算法
4.1.2 基于CO-TRAINING算法的虚假评论识别算法
4.2 基于TRI-TRAINING算法的虚假评论识别模型
4.2.1 TRI-TRAINING算法
4.2.2 基于TRI-TRAINING算法的虚假评论识别算法
4.3 基于CO-FOREST算法的虚假评论识别模型
4.3.1 CO-FOREST算法
4.3.2 基于CO-FOREST算法的虚假评论识别模型
4.4 本章小结
第五章 实验结果与分析
5.1 实验平台与评价指标
5.2 基于全监督框架的最优特征选择
5.2.1 全监督框架
5.2.2 特征实验结果
5.3 基于半监督学习的虚假评论识别模型实验结果分析
5.3.1 基于不同半监督学习算法的实验设计与结果分析
5.3.2 标注数据比例和参数敏感性的实验结果分析
5.4 本章小结
第六章 结论与展望
6.1 研究结论
6.2 研究展望
参考文献
攻读硕士学位期间发表的论文
后记
【参考文献】:
期刊论文
[1]基于DDAG-SVM的在线商品评论可信度分类模型[J]. 陈燕方. 情报理论与实践. 2017(07)
[2]一种基于启发式规则的半监督垃圾评论分类方法[J]. 张鹏,王素格,李德玉,王杰. 山东大学学报(理学版). 2017(07)
[3]在线商品虚假评论关键问题研究综述[J]. 朱娟. 现代情报. 2017(05)
[4]基于SVM分类模型的垃圾文本识别研究[J]. 黄正伟,唐芳艳. 数学的实践与认识. 2016(07)
[5]一种用于微博谣言检测的半监督学习算法[J]. 路同强,石冰,闫中敏,周珮. 计算机应用研究. 2016(03)
[6]基于特征表现的虚假评论人预测研究[J]. 聂卉,吴毅骏. 图书情报工作. 2015(10)
[7]基于随机森林的产品垃圾评论识别[J]. 何珑. 中文信息学报. 2015(03)
[8]基于PU学习算法的虚假评论识别研究[J]. 任亚峰,姬东鸿,张红斌,尹兰. 计算机研究与发展. 2015(03)
[9]在线商品虚假评论形成路径研究[J]. 陈燕方,娄策群. 现代情报. 2015(01)
[10]电子商务中垃圾评论检测的特征提取方法[J]. 游贵荣,吴为,钱沄涛. 现代图书情报技术. 2014(10)
本文编号:3125861
本文链接:https://www.wllwen.com/jingjilunwen/guojimaoyilunwen/3125861.html