电商平台购物虚假评论识别研究
发布时间:2023-03-20 02:05
随着互联网的发展与广大消费者对消费途径多样化的需求,电商平台发展迅速,网购也越发成为消费者进行购买活动的一个主流途径。消费者通过商品描述、价格,更主要的是通过商品评论信息来考察商品的质量及其他信息。一些商家为了吸引顾客,增加顾客的浏览、关注与购买,有偿雇佣一批网络刷单手,让他们在未收到和使用实际商品的情况下杜撰一些良好的评论以促使消费者对产品好感度提升,从而购买商品。这无疑会影响到消费者的决定,损害消费者的权益。因此,虚假评论的准确识别是一项重要且迫切的工作。本文的目的是给出一套对虚假评论进行精准、有效识别的方法及流程,并考察虚假评论的模式。主要采用数据挖掘方法实现虚假评论的识别工作,主要工作包括:获取不同电商平台的样本商品数据,对文本进行量化,通过评论时间、重复评论、评论者等级等信息进行虚假评论预识别;并采用Logistic回归、k最近邻模型、SVM模型、text-CNN模型、fast Text模型以及组合模型对虚假评论进行准确识别并进行验证;然后通过大量数据,考察虚假评论模式,构建虚假评论的语言模型,并从多维特征上考察虚假评论的行为属性以挖掘虚假评论在行为属性上的模式。本文创新点主...
【文章页数】:66 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第1章 绪论
1.1 研究背景
1.2 研究目的
1.3 研究现状
1.3.1 国外文献综述
1.3.2 国内文献综述
1.3.3 文献评述
1.4 研究思路
1.5 本文创新
1.6 论文组织结构
第2章 评论数据多维特征体系构建
2.1 虚假评论生产过程调研
2.2 数据说明
2.2.1 数据来源与获取方式
2.2.2 数据多维属性分析
2.3 文本量化及特征提取
2.3.1 文本分词处理
2.3.2 word2vec文本量化
第3章 虚假评论预识别
3.1 重复评论识别
3.2 评论时间分布
3.3 数据标注
第4章 虚假评论识别
4.1 虚假评论识别分类器构建
4.1.1 模型评价方法
4.1.2 Logistic模型
4.1.3 k最近邻模型
4.1.4 SVM模型
4.1.5 text-CNN
4.1.6 fastText
4.1.7 组合模型
4.2 虚假评论识别效果
第5章 虚假评论模式挖掘
5.1 虚假评论特征抽取与统计语言模型
5.1.1 虚假评论特征抽取
5.1.2 虚假评论统计语言模型构建
5.2 基于多维特征的虚假评论行为模式挖掘
结论与展望
参考文献
附录
致谢
本文编号:3766460
【文章页数】:66 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第1章 绪论
1.1 研究背景
1.2 研究目的
1.3 研究现状
1.3.1 国外文献综述
1.3.2 国内文献综述
1.3.3 文献评述
1.4 研究思路
1.5 本文创新
1.6 论文组织结构
第2章 评论数据多维特征体系构建
2.1 虚假评论生产过程调研
2.2 数据说明
2.2.1 数据来源与获取方式
2.2.2 数据多维属性分析
2.3 文本量化及特征提取
2.3.1 文本分词处理
2.3.2 word2vec文本量化
第3章 虚假评论预识别
3.1 重复评论识别
3.2 评论时间分布
3.3 数据标注
第4章 虚假评论识别
4.1 虚假评论识别分类器构建
4.1.1 模型评价方法
4.1.2 Logistic模型
4.1.3 k最近邻模型
4.1.4 SVM模型
4.1.5 text-CNN
4.1.6 fastText
4.1.7 组合模型
4.2 虚假评论识别效果
第5章 虚假评论模式挖掘
5.1 虚假评论特征抽取与统计语言模型
5.1.1 虚假评论特征抽取
5.1.2 虚假评论统计语言模型构建
5.2 基于多维特征的虚假评论行为模式挖掘
结论与展望
参考文献
附录
致谢
本文编号:3766460
本文链接:https://www.wllwen.com/jingjilunwen/jingjiguanlilunwen/3766460.html