面向社交媒体文本的论辩挖掘研究
发布时间:2023-04-04 20:54
随着互联网技术的发展,越来越多的民众乐意在社交媒体上发表自己的见解。围绕某个争议话题,用户的讨论交互形成了论辩。对论辩文本进行分析的论辩挖掘研究目的是从非结构化的论辩文本中自动提取论点、论据及其之间的逻辑关系。面向社交媒体文本的论辩挖掘研究可以自动发现用户论点,还可以帮助理解用户持有自己论点的理由,因此具有重要的学术和商业价值。现有的论辩挖掘方法主要包括基于特征工程机器学习的方法和基于深度学习的方法。基于特征工程机器学习的方法一般采用人工构建和筛选的特征来表示论点或论据,这些方法往往过程繁琐,同时也难以很好地建模论辩结构。基于深度学习的方法能够自动提取论辩文本的深层语义特征,但多数方法都将论辩挖掘的各个子任务独立分析,忽略了子任务之间的内在联系。针对上述问题,本文首先研究将论辩指示词信息引入注意力层次网络来有效识别论辩部件的方法。在此基础上,研究论辩部件识别和关系抽取的联合分析方法。本文首先研究结合论辩指示词信息和注意力层次网络的论辩部件识别方法。通过在注意力层次网络的基础上引入论辩指示词信息,设计实现了结合论辩指示词信息的注意力层次网络模型。该模型中的注意力层次网络能够有效建模文档的...
【文章页数】:63 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 课题研究的背景和意义
1.2 国内外相关研究概况
1.2.1 论辩挖掘研究现状
1.2.2 多任务学习研究现状
1.3 本文的主要研究内容
1.4 本文组织结构
第2章 相关技术概述
2.1 引言
2.2 论辩挖掘相关技术
2.2.1 基于特征工程机器学习的论辩挖掘方法
2.2.2 基于深度学习的论辩挖掘方法
2.3 多任务学习相关技术
2.4 本章小结
第3章 结合论辩指示词和注意力层次网络的论辩部件识别
3.1 引言
3.2 基于注意力层次网络的论辩部件识别方法
3.2.1 基于双向LSTM的文本序列编码器
3.2.2 注意力层次网络
3.3 结合论辩指示词信息的注意力层次网络
3.4 实验结果及分析
3.4.1 数据集
3.4.2 实验设置
3.4.3 总体性能实验结果与分析
3.4.4 对比实验结果与分析
3.5 本章小结
第4章 论辩部件识别和关系抽取联合分析研究
4.1 引言
4.2 基于多级共享模式的多任务学习框架
4.2.1 论辩关系抽取模块
4.2.2 最小树形图解码
4.2.3 多级共享模式
4.3 损失函数权重自调节策略
4.3.1 同方差不确定度
4.3.2 多任务损失函数构造方法
4.3.3 论辩部件识别和关系抽取联合损失函数
4.4 实验结果及分析
4.4.1 实验设置
4.4.2 总体性能实验结果与分析
4.4.3 对比实验结果与分析
4.4.4 样例分析
4.5 本章小结
结论
参考文献
攻读硕士学位期间发表的论文及其它成果
致谢
本文编号:3782028
【文章页数】:63 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 课题研究的背景和意义
1.2 国内外相关研究概况
1.2.1 论辩挖掘研究现状
1.2.2 多任务学习研究现状
1.3 本文的主要研究内容
1.4 本文组织结构
第2章 相关技术概述
2.1 引言
2.2 论辩挖掘相关技术
2.2.1 基于特征工程机器学习的论辩挖掘方法
2.2.2 基于深度学习的论辩挖掘方法
2.3 多任务学习相关技术
2.4 本章小结
第3章 结合论辩指示词和注意力层次网络的论辩部件识别
3.1 引言
3.2 基于注意力层次网络的论辩部件识别方法
3.2.1 基于双向LSTM的文本序列编码器
3.2.2 注意力层次网络
3.3 结合论辩指示词信息的注意力层次网络
3.4 实验结果及分析
3.4.1 数据集
3.4.2 实验设置
3.4.3 总体性能实验结果与分析
3.4.4 对比实验结果与分析
3.5 本章小结
第4章 论辩部件识别和关系抽取联合分析研究
4.1 引言
4.2 基于多级共享模式的多任务学习框架
4.2.1 论辩关系抽取模块
4.2.2 最小树形图解码
4.2.3 多级共享模式
4.3 损失函数权重自调节策略
4.3.1 同方差不确定度
4.3.2 多任务损失函数构造方法
4.3.3 论辩部件识别和关系抽取联合损失函数
4.4 实验结果及分析
4.4.1 实验设置
4.4.2 总体性能实验结果与分析
4.4.3 对比实验结果与分析
4.4.4 样例分析
4.5 本章小结
结论
参考文献
攻读硕士学位期间发表的论文及其它成果
致谢
本文编号:3782028
本文链接:https://www.wllwen.com/xinwenchuanbolunwen/3782028.html