基于三支决策的网络舆情不平衡文本倾向性分类研究
发布时间:2023-02-08 16:25
随着新媒体时代互联网技术和网上媒体平台的不断发展,网络舆情在社会上广泛迅速的传播。文本类型的网络舆情主要有两大特点:一是具有较强的倾向性,二是倾向性分布的不平衡。不平衡文本倾向性分类成为解决这一问题的关键性技术,以机器学习为基础的不平衡文本倾向性分类虽然能够在一定程度上提升分类器的性能,但是面对海量数据时会存在特征维数过高的缺陷,不能有效地选择出对类别贡献度高的特征词。三支决策在处理不确定信息方面有着较大的优势,能够综合考虑特征词的重要程度,从而选择出最具类别代表性的特征词。因此,本文结合三支决策理论,对特征选择算法展开研究工作,提出一种全新特征选择算法TWDFS。此外,本文在深度学习方面,提出一种多通道模型融合的分类方法,能够充分提取出文本中的深层语义信息,有效地提高分类器的性能。本文的主要研究工作主要包括:1.本文根据不平衡文本倾向性分类中特征分布和样本分布的特点,结合三支决策的基本思想,提出了一种全新的特征选择算法TWD-FS。首先,利用两种有监督特征选择方法生成特征词集合;其次,将两种有监督特征选择方法相结合,有效地减少了特征词的数量,降低了特征维度;最后,通过组合正负类情感特...
【文章页数】:77 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第1章 引言
1.1 研究背景和意义
1.2 国内外研究现状
1.2.1 基于机器学习的不平衡文本倾向性分类研究现状
1.2.2 基于深度学习的不平衡文本倾向性分类研究现状
1.2.3 三支决策国内外研究现状
1.2.4 模型融合的国内外现状
1.3 论文的主要工作
1.4 论文组织结构
第2章 相关基础理论
2.1 三支决策理论
2.1.1 三支决策的基本思想
2.1.2 三支决策的两种模式
2.2 不平衡文本倾向性分类理论
2.2.1 文本特征选择方法
2.2.2 机器学习文本倾向性分类算法
2.2.3 深度学习文本倾向性分类模型
2.3 本章小结
第3章 基于三支决策的不平衡文本特征选择方法
3.1 三支决策的划分和决策
3.1.1 三支决策区域划分定义
3.1.2 特征判别率定义
3.1.3 组合正负类倾向性特征
3.2 其他相关定义
3.2.1 双向卡方统计
3.2.2 构建情感词向量
3.3 TWD-FS算法
3.4 实验设计和分析
3.4.1 数据集
3.4.2 评价指标
3.4.3 实验方法
3.4.4 实验结果
3.5 本章小结
第4章 多通道模型融合的不平衡文本倾向性分类算法
4.1 文本语义表示
4.1.1 传统的文本语义表示
4.1.2 基于深度学习的文本语义表示
4.2 深度学习和不平衡文本倾向性分类
4.2.1 卷积神经网络(CNN)
4.2.2 长短期记忆神经网络(LSTM)
4.2.3 Transformer模型
4.3 多通道模型融合的不平衡文本倾向性分类算法
4.3.1 多通道TR-LSTM-CNN模型框架描述
4.3.2 多通道TR-LSTM-CNN模型算法描述
4.4 实验设计和分析
4.4.1 数据集
4.4.2 实验方法
4.4.3 实验结果
4.5 本章小结
第5章 总结与展望
5.1 主要工作和创新点
5.2 未来的工作和展望
参考文献
致谢
攻读硕士学位期间从事的科研工作及取得的成果
本文编号:3737999
【文章页数】:77 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第1章 引言
1.1 研究背景和意义
1.2 国内外研究现状
1.2.1 基于机器学习的不平衡文本倾向性分类研究现状
1.2.2 基于深度学习的不平衡文本倾向性分类研究现状
1.2.3 三支决策国内外研究现状
1.2.4 模型融合的国内外现状
1.3 论文的主要工作
1.4 论文组织结构
第2章 相关基础理论
2.1 三支决策理论
2.1.1 三支决策的基本思想
2.1.2 三支决策的两种模式
2.2 不平衡文本倾向性分类理论
2.2.1 文本特征选择方法
2.2.2 机器学习文本倾向性分类算法
2.2.3 深度学习文本倾向性分类模型
2.3 本章小结
第3章 基于三支决策的不平衡文本特征选择方法
3.1 三支决策的划分和决策
3.1.1 三支决策区域划分定义
3.1.2 特征判别率定义
3.1.3 组合正负类倾向性特征
3.2 其他相关定义
3.2.1 双向卡方统计
3.2.2 构建情感词向量
3.3 TWD-FS算法
3.4 实验设计和分析
3.4.1 数据集
3.4.2 评价指标
3.4.3 实验方法
3.4.4 实验结果
3.5 本章小结
第4章 多通道模型融合的不平衡文本倾向性分类算法
4.1 文本语义表示
4.1.1 传统的文本语义表示
4.1.2 基于深度学习的文本语义表示
4.2 深度学习和不平衡文本倾向性分类
4.2.1 卷积神经网络(CNN)
4.2.2 长短期记忆神经网络(LSTM)
4.2.3 Transformer模型
4.3 多通道模型融合的不平衡文本倾向性分类算法
4.3.1 多通道TR-LSTM-CNN模型框架描述
4.3.2 多通道TR-LSTM-CNN模型算法描述
4.4 实验设计和分析
4.4.1 数据集
4.4.2 实验方法
4.4.3 实验结果
4.5 本章小结
第5章 总结与展望
5.1 主要工作和创新点
5.2 未来的工作和展望
参考文献
致谢
攻读硕士学位期间从事的科研工作及取得的成果
本文编号:3737999
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3737999.html
最近更新
教材专著