基于混合神经网络的微博情感分类研究
发布时间:2023-04-12 04:27
随着现代信息技术的不断发展,世界已跨入“互联网+”与“Web2.0”的时代,使用社交媒体的用户数量急速增长,每天在各社交平台上传播的信息数据量也呈指数级增长。作为近年来快速发展的社交网络平台,微博为移动应用提供了便捷的合作模式,满足了用户在多元化移动终端中可以随时随地分享信息的需求,因此受到众多用户的广泛好评和使用。通过情感分类技术对微博文本进行分析,对于了解民众舆论倾向、了解用户需求、提高经济效益等都有重大的帮助。为提高中文微博分类效果并解决中文微博中广泛存在的一词多义现象,本文提出了一种基于混合神经网络的中文微博情感分类方法。在特征提取方面,将多种具有代表性的特征进行融合。在模型构建方面,提出一种结合卷积神经网络与循环神经网络的混合神经网络模型,该模型能够综合分析文本中的局部信息与顺序信息。本文的研究工作和创新点具体如下:(1)鉴于文本特征构建不够充分的问题,提出一种从多角度挖掘文本信息的特征构建方法。首先在语料库上通过BERT模型来预训练得到词嵌入特征,由于采取了预训练的方式,这种特征能够表征同一词语在不同语境下的多义性。然后提取其他特征,包括n-gram与词语情感极性得分特征。...
【文章页数】:57 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 背景和意义
1.2 国内外研究现状
1.3 问题难点和本文研究思路
1.4 本文内容安排
第二章 中文微博情感分类基础
2.1 中文微博特点
2.1.1 文本短、噪声大
2.1.2 多义词较多
2.1.3 符号较多
2.2 文本预处理
2.2.1 数据济洗与去噪
2.2.2 分词与词性标注
2.2.3 去停用词
2.3 义本特征表示方法
2.3.1 词袋模型
2.3.2 分布式表示模型
2.4 分类模型
2.4.1 逻辑回归模型
2.4.2 最大熵模型
2.4.3 支持向量机模型
2.5 本章小结
第三章 基于混合神经网络的微博情感分类方法
3.1 文本情感分类整体流程
3.2 传统神经网络模型
3.2.1 卷积神经网络模型
3.2.2 长短时记忆网络模型
3.2.3 卷积循环网络模型
3.3 混合神经网络模型
3.3.1 文本特征表示
3.3.2 改进的C-LSTM模型
3.4 本章小结
第四章 实验设计与结果分析
4.1 实验数据介绍
4.1.1 实验数据的采集
4.1.2 实验数据预处理
4.2 实验工具介绍
4.3 评测指标介绍
4.4 实验结果分析
4.4.1 对比模型选取与参数设计
4.4.2 特征选择的实验结果分析
4.4.3 情感分类的实验结果分析
4.5 本章小结
第五章 总结与展望
5.1 全文总结
5.2 展望
参考文献
致谢
本文编号:3790427
【文章页数】:57 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 背景和意义
1.2 国内外研究现状
1.3 问题难点和本文研究思路
1.4 本文内容安排
第二章 中文微博情感分类基础
2.1 中文微博特点
2.1.1 文本短、噪声大
2.1.2 多义词较多
2.1.3 符号较多
2.2 文本预处理
2.2.1 数据济洗与去噪
2.2.2 分词与词性标注
2.2.3 去停用词
2.3 义本特征表示方法
2.3.1 词袋模型
2.3.2 分布式表示模型
2.4 分类模型
2.4.1 逻辑回归模型
2.4.2 最大熵模型
2.4.3 支持向量机模型
2.5 本章小结
第三章 基于混合神经网络的微博情感分类方法
3.1 文本情感分类整体流程
3.2 传统神经网络模型
3.2.1 卷积神经网络模型
3.2.2 长短时记忆网络模型
3.2.3 卷积循环网络模型
3.3 混合神经网络模型
3.3.1 文本特征表示
3.3.2 改进的C-LSTM模型
3.4 本章小结
第四章 实验设计与结果分析
4.1 实验数据介绍
4.1.1 实验数据的采集
4.1.2 实验数据预处理
4.2 实验工具介绍
4.3 评测指标介绍
4.4 实验结果分析
4.4.1 对比模型选取与参数设计
4.4.2 特征选择的实验结果分析
4.4.3 情感分类的实验结果分析
4.5 本章小结
第五章 总结与展望
5.1 全文总结
5.2 展望
参考文献
致谢
本文编号:3790427
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3790427.html
最近更新
教材专著