基于情感分类的特征表示研究
发布时间:2023-08-10 17:52
近年来,神经网络(深度学习)研究发展迅猛,自然语言处理作为一个实用领域,是神经网络的主要攻坚对象之一。虽然神经网络在自然语言处理领域已经取得了非常喜人的成绩,但是需求与发展是无止尽的,在最基础的文本分类与情感分类任务中,仍有大量问题亟需解决。大多数分类模型对特征十分敏感,特征的优劣直接决定了分类器的分类效果。分布式特征表示是一种特征表示方法,也是神经网络的研究核心之一。在自然语言处理任务中,由于单词等自然语言特征具有离散性质,使用分布式表示对特征建模十分重要。本文以某公司的具体舆情分析需求为背景,以自然语言情感分类任务为目标,针对情感分类任务中的特征表示方法进行了一系列研究。本文的主要研究内容与贡献如下:1.针对情感分类任务,提出了一种单词表示(词向量)调整方法。现有的大多数词向量没有针对特定任务进行进一步调整。本文提出了词向量情感分量的概念,并尝试用情感分量解释词向量中携带的情感信息,最后利用情感词典和情感分量调整词向量。本文使用RT、IMDB两个情感分类任务测试词向量调整效果,相比迁移初始词向量,迁移调整后的词向量在多个模型上均有不同程度的效果提升。2.针对短文本,提出了一种多层级...
【文章页数】:96 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
符号表示
常见函数
第一章 绪论
1.1 研究背景与意义
1.2 本文工作与贡献
1.3 本文架构
第二章 单词特征表示研究综述
2.1 第一阶段
2.1.1 共现信息建模
2.1.2 神经网络语言模型建模
2.1.3 配分函数优化
2.2 第二阶段
2.2.1 独立训练词向量模型
2.2.2 词向量理论研究
2.2.3 词向量类推性质
2.3 第三阶段
2.4 本章总结
第三章 针对情感分类的词向量调整研究
3.1 相关工作
3.2 词向量情感信息调整
3.2.1 情感主成分与情感分量
3.2.2 情感信息调整
3.3 实验与效果分析
3.3.1 词向量情感信息分析实验
3.3.2 词向量混合比例实验
3.3.3 情感分类器词向量迁移实验
3.4 本章总结
第四章 多层级情感分类方案
4.1 需求分析与数据准备
4.1.1 问题定义
4.1.2 数据集准备
4.1.3 数据预处理
4.2 短文本分类器
4.2.1 LSTM-Attn模型
4.2.2 DAN模型
4.2.3 基模型集成
4.3 新闻文本分类器
4.4 实验与效果分析
4.4.1 模型超参数
4.4.2 基模型纵向性能比较实验
4.4.3 基模型集成实验
4.4.4 新闻文本分类器性能实验
4.4.5 短文本案例分析
4.5 本章总结
第五章 总结与展望
5.1 工作总结
5.2 未来展望
致谢
攻读硕士学位期间发表论文、参与科研和获得荣誉情况
本文编号:3840962
【文章页数】:96 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
符号表示
常见函数
第一章 绪论
1.1 研究背景与意义
1.2 本文工作与贡献
1.3 本文架构
第二章 单词特征表示研究综述
2.1 第一阶段
2.1.1 共现信息建模
2.1.2 神经网络语言模型建模
2.1.3 配分函数优化
2.2 第二阶段
2.2.1 独立训练词向量模型
2.2.2 词向量理论研究
2.2.3 词向量类推性质
2.3 第三阶段
2.4 本章总结
第三章 针对情感分类的词向量调整研究
3.1 相关工作
3.2 词向量情感信息调整
3.2.1 情感主成分与情感分量
3.2.2 情感信息调整
3.3 实验与效果分析
3.3.1 词向量情感信息分析实验
3.3.2 词向量混合比例实验
3.3.3 情感分类器词向量迁移实验
3.4 本章总结
第四章 多层级情感分类方案
4.1 需求分析与数据准备
4.1.1 问题定义
4.1.2 数据集准备
4.1.3 数据预处理
4.2 短文本分类器
4.2.1 LSTM-Attn模型
4.2.2 DAN模型
4.2.3 基模型集成
4.3 新闻文本分类器
4.4 实验与效果分析
4.4.1 模型超参数
4.4.2 基模型纵向性能比较实验
4.4.3 基模型集成实验
4.4.4 新闻文本分类器性能实验
4.4.5 短文本案例分析
4.5 本章总结
第五章 总结与展望
5.1 工作总结
5.2 未来展望
致谢
攻读硕士学位期间发表论文、参与科研和获得荣誉情况
本文编号:3840962
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3840962.html
最近更新
教材专著