面向新闻文本的基于深度学习的事件线抽取
发布时间:2021-03-17 08:15
随着互联网的快速发展,在线的新闻媒体站点源源不断地产生和传播每天发生的各种各样的事件。面对如此庞大的信息量,不借助自动化工作,公众很难有效地从中获取自己想要的信息。事件线抽取(Storyline Extraction),旨在从海量的新闻文本中自动地抽取和总结热点事件,并以结构化的方式跟踪和揭示事件是如何随着时间发展。很显然,事件线的抽取将有助于读者面对海量的新闻文本,清晰把握,了解当前发生的主要事件的发展脉络。因此,具有十分重要的现实意义和应用价值。目前已有若干面向新闻文本的事件线抽取方法被提出,其中大多数方法基于贝叶斯概率图模型,采用无监督的方式。相比于有监督方法,无监督更贴近人类学习的方式,无需进行数据标注,更加稳定与通用,因此广受研究人员的关注。但是,概率图模型一类的方法通常存在模型结构复杂,运算耗时等问题。考虑到深度学习在自然语言处理领域的广泛应用,相比较于传统方法,深度学习能够自动学到海量数据中隐含的语义信息并完成特征抽取,具备挖掘深层次特征的能力,因此已经在多个自然语言处理的任务当中取得了显著的表现。因此,本文针对面向新闻文本的基于深度学习的事件线抽取方法进行研究,结合深度...
【文章来源】:东南大学江苏省 211工程院校 985工程院校 教育部直属院校
【文章页数】:69 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景与意义
1.2 相关工作研究现状
1.2.1 主题检测与跟踪
1.2.2 事件线抽取的研究现状
1.3 本文研究动机
1.3.1 现有方法的局限性
1.3.2 基于深度学习的事件线抽取面临困难与挑战
1.4 论文研究目标与内容
1.5 本文组织架构
第二章 理论知识及相关技术
2.1 问题定义
2.2 理论知识
2.2.1 多层感知机
2.2.2 激活函数
2.2.3 自编码器
2.2.4 损失函数
2.2.5 词嵌入向量
2.3 动态事件线抽取模型
第三章 基于NSEM模型的新闻文本事件线抽取
3.1 研究动机
3.2 NSEM模型
3.2.1 相似性假设
3.2.2 模型结构
3.2.3 事件线构造
3.2.4 训练
3.2.5 后处理
3.3 实验结果
3.3.1 实验设置
3.3.2 结果分析
3.3.3 事件线数目S的影响
3.3.4 时间复杂度
3.3.5 结构化展示
3.3.6 事件线分布的可视化
3.4 本章小结
第四章 基于DESEM模型的新闻文本事件线抽取
4.1 研究动机
4.2 DESEM模型
4.2.1 隐事件映射
4.2.2 事件线分布学习
4.2.3 事件线构造
4.2.4 训练
4.2.5 优化
4.3 实验结果
4.3.1 实验设置
4.3.2 评估准则
4.3.3 实验结果
4.3.4 消融研究
4.3.5 事件表示的可视化
4.4 本章小结
第五章 结束语
5.1 工作总结
5.2 未来展望
致谢
参考文献
作者简介
【参考文献】:
期刊论文
[1]开放式文本信息抽取[J]. 赵军,刘康,周光有,蔡黎. 中文信息学报. 2011(06)
硕士论文
[1]基于新闻文本的事件线抽取[D]. 徐海洋.东南大学 2017
本文编号:3086843
【文章来源】:东南大学江苏省 211工程院校 985工程院校 教育部直属院校
【文章页数】:69 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景与意义
1.2 相关工作研究现状
1.2.1 主题检测与跟踪
1.2.2 事件线抽取的研究现状
1.3 本文研究动机
1.3.1 现有方法的局限性
1.3.2 基于深度学习的事件线抽取面临困难与挑战
1.4 论文研究目标与内容
1.5 本文组织架构
第二章 理论知识及相关技术
2.1 问题定义
2.2 理论知识
2.2.1 多层感知机
2.2.2 激活函数
2.2.3 自编码器
2.2.4 损失函数
2.2.5 词嵌入向量
2.3 动态事件线抽取模型
第三章 基于NSEM模型的新闻文本事件线抽取
3.1 研究动机
3.2 NSEM模型
3.2.1 相似性假设
3.2.2 模型结构
3.2.3 事件线构造
3.2.4 训练
3.2.5 后处理
3.3 实验结果
3.3.1 实验设置
3.3.2 结果分析
3.3.3 事件线数目S的影响
3.3.4 时间复杂度
3.3.5 结构化展示
3.3.6 事件线分布的可视化
3.4 本章小结
第四章 基于DESEM模型的新闻文本事件线抽取
4.1 研究动机
4.2 DESEM模型
4.2.1 隐事件映射
4.2.2 事件线分布学习
4.2.3 事件线构造
4.2.4 训练
4.2.5 优化
4.3 实验结果
4.3.1 实验设置
4.3.2 评估准则
4.3.3 实验结果
4.3.4 消融研究
4.3.5 事件表示的可视化
4.4 本章小结
第五章 结束语
5.1 工作总结
5.2 未来展望
致谢
参考文献
作者简介
【参考文献】:
期刊论文
[1]开放式文本信息抽取[J]. 赵军,刘康,周光有,蔡黎. 中文信息学报. 2011(06)
硕士论文
[1]基于新闻文本的事件线抽取[D]. 徐海洋.东南大学 2017
本文编号:3086843
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3086843.html
最近更新
教材专著