面向数据特性的文本情感分析方法研究
发布时间:2021-01-19 06:06
社交媒体与电商平台为数以亿计的用户提供着便捷的工作、生活和社交娱乐服务的同时,也散布着海量的文本数据,其中,用户生成的文本数据中蕴含着丰富的情感信息。深入分析、挖掘这些数据中隐含的情感信息,服务于社会管理和商业运营,正是文本情感分析技术追求的目标。文本情感分析是指综合运用自然语言处理与机器学习等技术对文本中的情感信息进行抽取、处理、分析和推理的过程。社会媒体中的文本数据纷繁复杂,观察和统计表明,社会媒体数据具有:类别非平衡、标签数据缺乏、情感表达隐晦、情感载体多样等特性,这些数据特性给文本情感分析带来了巨大挑战。针对上述数据特性,本文旨在运用数据采样、半监督学习、嵌入表示、深度学习等技术,围绕文本情感分类、反问与反讽句识别、可解释推荐模型建立等问题,开展系统深入的研究,发展文本情感分析理论与方法。主要研究内容与创新点如下:(1)局部稠密下采样与全局再平衡的文本情感分类方法非平衡文本情感分类。社会媒体评论文本数据的情感类别非平衡性会导致分类模型的偏置问题,从而影响模型的分类效果。本文提出了一种局部稠密区域下采样与全局再平衡的文本情感分类方法(LDMRC+SS/RS)。该方法在局部稠密边界...
【文章来源】:山西大学山西省
【文章页数】:137 页
【学位级别】:博士
【文章目录】:
中文摘要
英文摘要
第一章 绪论
1.1 研究背景及意义
1.2 国内外研究动态
1.2.1 非平衡文本情感分类
1.2.2 半监督文本情感分类
1.2.3 隐式情感分析
1.2.4 方面项情感分析
1.2.5 可解释产品推荐
1.3 研究内容
1.4 论文组织结构
第二章 基于LDMRC算法与全局再平衡的文本情感分类
2.1 问题提出
2.2 基本概念
2.3 局部稠密混合区域下采样+全局再平衡
2.3.1 LDMRC算法
2.3.2 数据的全局再平衡策略
2.4 文本情感分类步骤
2.5 实验设置
2.5.1 实验数据
2.5.2 采样方案
2.5.3 评价指标
2.6 实验结果与分析
2.6.1 算法参数的确定
2.6.2 采样方案比较
2.7 本章小结
第三章 文本情感分类的协同混合半监督学习
3.1 问题提出
3.2 一些相关度量
3.3 学习框架
3.3.1 种子选择算法
3.3.2 训练数据集更新
3.3.3 协同训练策略
3.3.4 集成分类器
3.4 文本情感分类步骤
3.5 实验设置
3.5.1 实验数据
3.5.2 评价指标
3.5.3 训练模式设计
3.6 实验结果与分析
3.6.1 种子选择方法
3.6.2 英文数据集上的比较实验
3.6.3 中文数据集上的比较实验
3.6.4 CASCT方法的稳定性
3.7 本章小结
第四章 基于语言特征自动获取的反问句识别
4.1 问题提出
4.2 反问句识别模型
4.2.1 反问句特征自动获取模型
4.2.2 基于层叠注意力机制的反问句识别模型
4.3 实验设置
4.3.1 数据集及评价指标
4.3.2 参数设置
4.4 实验结果与分析
4.4.1 特征性能的比较实验
4.4.2 特征数对识别效果的影响
4.4.3 综合比较实验
4.4.4 错误分析
4.5 本章小结
第五章 基于多信息融合的反讽句识别
5.1 问题提出
5.2 基于BERT的句子表示
5.3 融入显式特征信息的句子表示
5.4 情感信息获取
5.4.1 基于BERT的句子情感分类
5.4.2 句子情感差异表示
5.5 多信息融合的反讽句识别框架
5.6 实验设置
5.6.1 实验数据及评价指标
5.6.2 方法的比较方案
5.7 实验结果与分析
5.7.1 特征的有效性对比实验
5.7.2 与其他方法的对比实验
5.8 本章小结
第六章 基于方面项情感分析的可解释推荐
6.1 问题提出
6.2 方面项抽取
6.2.1 方面项情感判别
6.2.2 方面项确定
6.3 基于图神经网络的推荐模型
6.3.1 用户-产品图建模
6.3.2 基于注意力机制的图更新
6.3.3 模型输出与训练
6.4 产品评级策略
6.5 实验设置
6.6 实验结果与分析
6.6.1 产品评级融合参数的选取
6.6.2 产品评级策略对比实验
6.6.3 与已有方法的比较
6.6.4 推荐的可解释性
6.7 本章小结
第七章 总结及展望
7.1 主要结论
7.2 未来工作
参考文献
攻读博士学位期间取得的研究成果
致谢
个人简况及联系方式
本文编号:2986474
【文章来源】:山西大学山西省
【文章页数】:137 页
【学位级别】:博士
【文章目录】:
中文摘要
英文摘要
第一章 绪论
1.1 研究背景及意义
1.2 国内外研究动态
1.2.1 非平衡文本情感分类
1.2.2 半监督文本情感分类
1.2.3 隐式情感分析
1.2.4 方面项情感分析
1.2.5 可解释产品推荐
1.3 研究内容
1.4 论文组织结构
第二章 基于LDMRC算法与全局再平衡的文本情感分类
2.1 问题提出
2.2 基本概念
2.3 局部稠密混合区域下采样+全局再平衡
2.3.1 LDMRC算法
2.3.2 数据的全局再平衡策略
2.4 文本情感分类步骤
2.5 实验设置
2.5.1 实验数据
2.5.2 采样方案
2.5.3 评价指标
2.6 实验结果与分析
2.6.1 算法参数的确定
2.6.2 采样方案比较
2.7 本章小结
第三章 文本情感分类的协同混合半监督学习
3.1 问题提出
3.2 一些相关度量
3.3 学习框架
3.3.1 种子选择算法
3.3.2 训练数据集更新
3.3.3 协同训练策略
3.3.4 集成分类器
3.4 文本情感分类步骤
3.5 实验设置
3.5.1 实验数据
3.5.2 评价指标
3.5.3 训练模式设计
3.6 实验结果与分析
3.6.1 种子选择方法
3.6.2 英文数据集上的比较实验
3.6.3 中文数据集上的比较实验
3.6.4 CASCT方法的稳定性
3.7 本章小结
第四章 基于语言特征自动获取的反问句识别
4.1 问题提出
4.2 反问句识别模型
4.2.1 反问句特征自动获取模型
4.2.2 基于层叠注意力机制的反问句识别模型
4.3 实验设置
4.3.1 数据集及评价指标
4.3.2 参数设置
4.4 实验结果与分析
4.4.1 特征性能的比较实验
4.4.2 特征数对识别效果的影响
4.4.3 综合比较实验
4.4.4 错误分析
4.5 本章小结
第五章 基于多信息融合的反讽句识别
5.1 问题提出
5.2 基于BERT的句子表示
5.3 融入显式特征信息的句子表示
5.4 情感信息获取
5.4.1 基于BERT的句子情感分类
5.4.2 句子情感差异表示
5.5 多信息融合的反讽句识别框架
5.6 实验设置
5.6.1 实验数据及评价指标
5.6.2 方法的比较方案
5.7 实验结果与分析
5.7.1 特征的有效性对比实验
5.7.2 与其他方法的对比实验
5.8 本章小结
第六章 基于方面项情感分析的可解释推荐
6.1 问题提出
6.2 方面项抽取
6.2.1 方面项情感判别
6.2.2 方面项确定
6.3 基于图神经网络的推荐模型
6.3.1 用户-产品图建模
6.3.2 基于注意力机制的图更新
6.3.3 模型输出与训练
6.4 产品评级策略
6.5 实验设置
6.6 实验结果与分析
6.6.1 产品评级融合参数的选取
6.6.2 产品评级策略对比实验
6.6.3 与已有方法的比较
6.6.4 推荐的可解释性
6.7 本章小结
第七章 总结及展望
7.1 主要结论
7.2 未来工作
参考文献
攻读博士学位期间取得的研究成果
致谢
个人简况及联系方式
本文编号:2986474
本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/2986474.html