篇章级事件表示及相关性计算
发布时间:2023-11-15 17:27
事件抽取一直是学术研究的热点,对话或文章的核心信息往往是一个或者多个事件。因此,事件提取可以为聚类、推荐、推理等任务提供关键信息和重要特征。随着互联网信息流的不断发展,人们获取信息的主要来源不再是主动搜索,而是被动推荐。今日头条、天天快报等依靠个性化推荐新闻而提升用户粘性的产品不断涌现。此类内容推荐通常在分析用户感兴趣的事件的基础上,推送相同或类似事件的文章。这就首先要对篇章级的事件进行提取,并依据于此对篇章进行分类。而当前事件提取的主要研究方向为句子级事件的提取,篇章级事件研究较少,具有很高的研究价值。本文针对天天快报新闻语料,从标题、文章两个方面进行篇章级事件关键词的提取以及事件相关性计算。本文采用短文本相似度的计算方法对两篇新闻的标题相似程度进行计算,并将其作为新闻事件相关性计算的第一个指标。一篇新闻为了报导的完整性以及阅读的流畅性,往往在报导核心事件外,也会涵盖事件的历史信息、相关事件、相关人物等内容,这些内容属于冗余信息。为了更准确地提取核心事件,本文在筛选文章的关键信息之后,再对关键事件词进行抽取,并依据此计算文章的事件相关性,并将其作为新闻事件相关性计算的第二个指标。将两...
【文章页数】:62 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 课题背景及研究目的和意义
1.2 国内外研究现状
1.2.1 文本摘要方法研究
1.2.2 事件抽取方法研究
1.3 本文的主要研究内容
1.4 本文的章节安排
第2章 关键事件信息筛选
2.1 关键子句筛选及词语重要性计算
2.1.1 子句连通图的构建
2.1.2 EM思想基础
2.1.3 Text Rank算法基础
2.1.4 基于EM思想的Text Rank算法
2.1.5 模型效果演示
2.2 关键事件词筛选
2.2.1 句子级事件提取..ZORE
2.2.2 句子级事件多边形构建
2.2.3 句子级事件连通图的构建
2.2.4 随机游走(Text Rank)计算节点的权重
2.2.5 模型效果演示
2.3 本章小结
第3章 关键事件词词向量调整
3.1 基于VERB NET的动词词向量调整
3.1.1 VerbNet简介
3.1.2 同义约束和吸引约束
3.1.3 同义词向量调整模型
3.2 基于DEEP WALK的节点词词向量调整
3.2.1 DeepWalk算法流程
3.2.2 随机游走生成节点序列
3.2.3 DeepWalk中的Skip-Gram模型
3.3 本章小结
第4章 标题相似度计算
4.1 模型的假设
4.2 预训练SEQ2SEQ模型
4.3 实验结果及分析
4.4 本章小结
第5章 篇章级事件相似度计算
5.1 相似度计算模型
5.2 试验结果与分析
5.2.1 数据集及实验环境
5.2.2 对比实验设计
5.2.3 结果及分析
5.3 本章小结
结论
参考文献
致谢
本文编号:3864175
【文章页数】:62 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 课题背景及研究目的和意义
1.2 国内外研究现状
1.2.1 文本摘要方法研究
1.2.2 事件抽取方法研究
1.3 本文的主要研究内容
1.4 本文的章节安排
第2章 关键事件信息筛选
2.1 关键子句筛选及词语重要性计算
2.1.1 子句连通图的构建
2.1.2 EM思想基础
2.1.3 Text Rank算法基础
2.1.4 基于EM思想的Text Rank算法
2.1.5 模型效果演示
2.2 关键事件词筛选
2.2.1 句子级事件提取..ZORE
2.2.2 句子级事件多边形构建
2.2.3 句子级事件连通图的构建
2.2.4 随机游走(Text Rank)计算节点的权重
2.2.5 模型效果演示
2.3 本章小结
第3章 关键事件词词向量调整
3.1 基于VERB NET的动词词向量调整
3.1.1 VerbNet简介
3.1.2 同义约束和吸引约束
3.1.3 同义词向量调整模型
3.2 基于DEEP WALK的节点词词向量调整
3.2.1 DeepWalk算法流程
3.2.2 随机游走生成节点序列
3.2.3 DeepWalk中的Skip-Gram模型
3.3 本章小结
第4章 标题相似度计算
4.1 模型的假设
4.2 预训练SEQ2SEQ模型
4.3 实验结果及分析
4.4 本章小结
第5章 篇章级事件相似度计算
5.1 相似度计算模型
5.2 试验结果与分析
5.2.1 数据集及实验环境
5.2.2 对比实验设计
5.2.3 结果及分析
5.3 本章小结
结论
参考文献
致谢
本文编号:3864175
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3864175.html