基于深度学习的商品虚假评论识别

发布时间:2022-09-17 22:29
  随着电子商务产业的迅猛发展,网络购物模式日趋成熟,商品在线评论系统应运而生,顾客可以根据商品评价选择产品,商家也可以根据评论及时获得消费者的反馈。在大数据的时代背景下,商品评论数量爆炸一般呈指数增长,由于顾客对于评价的重视程度越来越高,一些商家开始投机取巧,雇佣刷客对自己的商品进行批量好评,这往往会误导消费者去挑选真正适合自己的商品。在商品质量参差不齐的今天,怎么样从海量的商品评论数据中过滤出真实有效的评论成为了一个急需解决的问题。然而由于虚假评论数据量大,隐藏性较高,识别它们成了一个棘手的难题。得益于机器学习的广泛推广,我们可以利用模型对评论进行分析拟合,然而得到的模型仍然具有识别效率低,识别准确率低的问题,受神经网络的启发,我们可以利用深度学习网络模型来解决这些问题,本文主要从以下三方面进行了研究工作:(1)为解决在繁琐、冗长的中文文本预处理过程中由于流程不明确,导致耗时长、得到预处理数据不理想的问题,提出了一个文本数据预处理流程框架,并根据这个流程对本文实验中的评论数据进行预处理。为了给深度学习模型的实验性能设置对照组,对基于特征工程的各种特征提取方法和分类模型一一组合进行试验,... 

【文章页数】:71 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
第一章 绪论
    1.1 选题背景和意义
    1.2 国内外研究现状
        1.2.1 基于识别虚假文本的研究现状
        1.2.2 基于识别虚假评论者的研究现状
        1.2.3 存在的问题
    1.3 本文的主要研究内容
        1.3.1 研究目标
        1.3.2 研究内容
    1.4 关键问题和研究方案
        1.4.1 关键问题分析
        1.4.2 研究方案
    1.5 本文的结构安排
第二章 数据处理与特征工程识别模型
    2.1 数据集
    2.2 数据预处理
    2.3 基于特征工程的识别模型
        2.3.1 文本特征提取
        2.3.2 文本分类算法
        2.3.3 评估指标
        2.3.4 结果分析
    2.4 本章小结
第三章 基于深度学习的虚假评论识别模型
    3.1 模型设计基础
        3.1.1 卷积神经网络
        3.1.2 循环神经网络
        3.1.3 混合模型思想
    3.2 混合神经网络模型
        3.2.1 文本表示
        3.2.2 局部特征
        3.2.3 全局特征
        3.2.4 文本分类
    3.3 模型优化策略
        3.3.1 Relu激活函数
        3.3.2 Dropout层
        3.3.3 Mini-batch梯度下降
    3.4 实验与分析
        3.4.1 对比模型
        3.4.2 模型训练
        3.4.3 结果和分析
        3.4.4 深度学习模型优势分析
    3.5 本章小结
第四章 使用预训练词向量优化模型
    4.1 数据获取
    4.2 Word2Vec
        4.2.1 CBOW模型和Skip-gram模型
        4.2.2 优化算法
    4.3 实验结果及分析
    4.4 本章小结
第五章 总结和展望
    5.1 研究结论
    5.2 研究展望
致谢
参考文献


【参考文献】:
期刊论文
[1]基于主题模型和情感分析的垃圾评论识别方法研究[J]. 金相宏,李琳,钟珞.  计算机科学. 2017(10)
[2]基于情感极性与SMOTE过采样的虚假评论识别方法[J]. 缪裕青,欧威健,刘同来,刘水清,文益民.  计算机应用研究. 2018(07)
[3]基于个人–群体–商户关系模型的虚假评论识别研究[J]. 余传明,冯博琳,左宇恒,陈百云,安璐.  北京大学学报(自然科学版). 2017(02)
[4]基于情感特征和用户关系的虚假评论者的识别[J]. 邵珠峰,姬东鸿.  计算机应用与软件. 2016(05)
[5]融合情感极性和逻辑回归的虚假评论检测方法[J]. 赵军,王红.  智能系统学报. 2016(03)
[6]在线商品虚假评论形成路径研究[J]. 陈燕方,娄策群.  现代情报. 2015(01)
[7]基于评论图的虚假产品评论人的检测[J]. 王琢,李准,徐野,宋凯.  计算机科学. 2014(10)
[8]网络水军识别研究[J]. 莫倩,杨珂.  软件学报. 2014(07)
[9]基于语言结构和情感极性的虚假评论识别[J]. 任亚峰,尹兰,姬东鸿.  计算机科学与探索. 2014(03)
[10]基于自适应聚类的虚假评论检测[J]. 宋海霞,严馨,余正涛,石林宾,苏斐.  南京大学学报(自然科学版). 2013(04)

博士论文
[1]基于深度学习的短文本分析与计算方法研究[D]. 李岩.北京科技大学 2016

硕士论文
[1]基于深度学习的短信分类技术研究[D]. 王婷.长安大学 2016
[2]基于深度学习的短文本语义相似度计算[D]. 陈晓阳.北京理工大学 2015
[3]基于深度学习的短文本情感倾向性研究[D]. 李然.北京理工大学 2015



本文编号:3680056

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3680056.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1b4d0***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com