基于酒业大数据的舆情信息分析研究

发布时间:2021-02-07 07:35
  近年来,中国主要的白酒企业都在积极努力进行数字化转型升级,在这个过程中,要想深度挖掘用户偏好和把握行业热点就必须对网络上的相关舆情信息进行充分分析。然而网络上的评论、新闻和动态都没有明确的类别标签,这增加了舆情分析的难度。如何有效分析大量的网络舆情文本是各个酒企都面临的问题。传统的舆情信息分析,大多是基于监督学习的模型且各个模型之间相互独立缺少联系,本文针对网络舆情数据样本量大且标注困难等问题,提出了新的解决思路。本文主要进行了以下研究:1)本文利用基于图卷积的半监督文本分类模型对舆情信息进行分类。网络爬虫采集的舆情信息杂乱无章,首先需要按照一定的标准进行主题分类。由于网络舆情数据量较大且标注数据成本过高,有标注数据占比较少,所以传统的有监督文本分类算法在这种场景下效果不理想。本文为了解决这个问题,提出了一种基于图卷积网络的半监督文本分类算法SS-GCN,将文本分类任务转化为图分类任务,实现了半监督学习,分类准确率为0.896。通过与经典的文本分类算法进行对比实验证实了基于图卷积的半监督学习的可行性和高效性。2)本文通过增加初始化聚类和倒排索引的方式对Single-Pass算法进行了改... 

【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校

【文章页数】:84 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
第一章 绪论
    1.1 研究背景及意义
    1.2 国内外相关研究现状
        1.2.1 文本分类研究现状
        1.2.2 话题检测研究现状
        1.2.3 情感分类研究现状
    1.3 本文的主要工作和创新点
    1.4 本文结构安排
第二章 舆情分析相关理论基础
    2.1 酒业舆情信息数据预处理
        2.1.1 数据清洗
        2.1.2 中文分词
        2.1.3 去停用词
        2.1.4 词向量技术
    2.2 经典文本分类算法
        2.2.1 朴素贝叶斯
        2.2.2 Hierarchical Attention Network
    2.3 经典话题检测算法
        2.3.1 基于密度的聚类算法
        2.3.2 Single-Pass算法
    2.4 经典情感分类算法
        2.4.1 情感词典
    2.5 半监督学习
    2.6 图卷积网络
    2.7 GRU
    2.8 本章小结
第三章 基于SS-GCN的酒业舆情分类算法
    3.1 数据采集与预处理
        3.1.1 数据采集
        3.1.2 数据清洗和标注
        3.1.3 文本分词和去停用词
    3.2 SS-GCN半监督文本分类模型
        3.2.1 文本图表示
        3.2.2 两层图卷积网络
        3.2.3 softmax层
    3.3 实验与结果分析
        3.3.1 实验环境
        3.3.2 分类模型评价指标
        3.3.3 实验设计
        3.3.4 滑动窗口的影响
        3.3.5 隐藏层维度的影响
        3.3.6 标注数据的占比的影响
        3.3.7 单词-文档嵌入可视化
        3.3.8 不同模型对比实验
    3.4 本章小结
第四章 基于改进Single-Pass的酒业舆情话题检测算法
    4.1 话题检测数据集
    4.2 一种改进的Single-Pass算法
    4.3 声量计算
    4.4 实验与结果分析
        4.4.1 实验环境
        4.4.2 聚类模型评价指标
        4.4.3 实验设计
        4.4.4 模型聚类效果对比
        4.4.5 模型执行时间对比
        4.4.6 事件声量趋势
    4.5 本章小结
第五章 基于Attention-BiGRU-CNN的酒业舆情情感分类算法
    5.1 情感分类数据集
    5.2 Attention-BiGRU-CNN情感分类模型
        5.2.1 文档表示模块
        5.2.2 卷积神经网络模块
        5.2.3 输出层
    5.3 实验与结果分析
        5.3.1 实验环境
        5.3.2 实验设计
        5.3.3 模型分类效果对比
        5.3.4 卷积核大小的影响
        5.3.5 特征图数量的影响
    5.4 本章小结
第六章 全文总结与展望
    6.1 全文总结
    6.2 后续工作展望
致谢
参考文献
攻读硕士学位期间取得的成果



本文编号:3021910

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3021910.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户29061***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com