面向热点话题的因果事理图谱构建及应用研究
发布时间:2023-12-02 10:49
随着互联网的高速发展及移动设备的普及,人们获取热点话题的途径越来越多,每隔一段时间都会发生当下讨论度最高的话题。各个平台的报道消息使得人们检索话题中关键信息的时间增加,对于一起事件的前因后果及防护措施没有一个直观的表达。话题事件是实时的动态数据,会随着时间、地点、人物等因素下会触发不同的事件结果,研究事件间的因果逻辑是自然文本处理的一项难题。近些年知识图谱技术得到了广泛的研究,但着重解决的是静态数据问题。对于动态数据的研究提出了事理图谱概念,它是一种事理逻辑知识库,描述事件间的演化规律。针对以上问题,本文面向热点话题构建因果事理图谱,利用事件抽取技术抽取出事件的元素,利用事件关系抽取技术获得事件间的逻辑关系,在此基础上实现话题查询与智能问答功能,主要完成工作如下:提出了热点话题的事理图谱构建框架,首先数据源的获取采用Scrapy爬虫框架,以时间降序排序。基于热点话题标题采用Kmeans无监督算法将数据源分为几类话题。定义事件的元素由事件参与者、事件触发词、事件发生地点、事件发生时间、事件发生程度组成。其次采用序列标注方法,将事件抽取研究转化为序列标注任务,实现从热点话题事件中抽取事件元...
【文章页数】:58 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.2.1 知识图谱的研究现状
1.2.2 事理图谱的研究现状
1.2.3 知识图谱与事理图谱
1.3 论文的研究内容
1.4 论文的组织架构
第二章 相关理论与技术
2.1 信息抽取
2.1.1 命名实体识别
2.1.2 事件抽取
2.1.3 事件关系抽取
2.2 词向量模型
2.2.1 Word2Vec模型
2.2.2 BERT模型
2.3 循环神经网络
2.3.1 RNN循环神经网络
2.3.2 长短时记忆神经网络
2.3.3 流形的LSTM神经网络
2.4 本章小结
第三章 基于热点话题的事件抽取研究
3.1 事件语料库构建
3.1.1 数据来源
3.1.2 数据聚类
3.1.3 数据标注方法
3.2 事件抽取研究方案
3.2.1 基于CRF抽取模型
3.2.2 基于BERT+Bi-LSTM+CRF抽取模型
3.2.3 基于BERT+Bi-LSTM+Attention+CRF抽取模型
3.3 实验结果与分析
3.3.1 数据集划分
3.3.2 评价指标
3.3.3 实验结果
3.4 本章小结
第四章 基于热点话题的事件因果关系抽取研究
4.1 显式事件因果关系抽取
4.1.1 关联词知识库
4.1.2 基于依存句法分析的事件表示
4.2 事件句的隐式事件因果关系抽取
4.2.1 数据标注方法
4.2.2 基于BERT+Bi-LSTM+Attention+CRF抽取模型
4.3 事件对的隐式事件因果关系抽取
4.3.1 候选事件对
4.3.2 事件间规则特征
4.3.3 结合事件间规则特征和Bi-GRU抽取模型
4.4 因果事件相似度计算
4.5 实验结果与分析
4.6 本章小结
第五章 事理图谱的存储及应用系统设计
5.1 事理图谱的存储
5.1.1 NoSQL数据库介绍
5.1.2 Neo4j图数据库
5.1.3 事理图谱的存储方案设计
5.2 事理图谱应用系统设计
5.2.1 应用系统设计
5.2.2 系统的框架设计
5.2.3 数据查询层设计
5.2.4 业务逻辑层设计
5.3 事理图谱应用功能实现
5.3.1 系统功能介绍
5.3.2 热点话题查询
5.3.3 智能问答功能
5.4 本章小结
第六章 总结与展望
6.1 工作总结
6.2 研究展望
参考文献
攻读学位期间的研究成果
致谢
本文编号:3869514
【文章页数】:58 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.2.1 知识图谱的研究现状
1.2.2 事理图谱的研究现状
1.2.3 知识图谱与事理图谱
1.3 论文的研究内容
1.4 论文的组织架构
第二章 相关理论与技术
2.1 信息抽取
2.1.1 命名实体识别
2.1.2 事件抽取
2.1.3 事件关系抽取
2.2 词向量模型
2.2.1 Word2Vec模型
2.2.2 BERT模型
2.3 循环神经网络
2.3.1 RNN循环神经网络
2.3.2 长短时记忆神经网络
2.3.3 流形的LSTM神经网络
2.4 本章小结
第三章 基于热点话题的事件抽取研究
3.1 事件语料库构建
3.1.1 数据来源
3.1.2 数据聚类
3.1.3 数据标注方法
3.2 事件抽取研究方案
3.2.1 基于CRF抽取模型
3.2.2 基于BERT+Bi-LSTM+CRF抽取模型
3.2.3 基于BERT+Bi-LSTM+Attention+CRF抽取模型
3.3 实验结果与分析
3.3.1 数据集划分
3.3.2 评价指标
3.3.3 实验结果
3.4 本章小结
第四章 基于热点话题的事件因果关系抽取研究
4.1 显式事件因果关系抽取
4.1.1 关联词知识库
4.1.2 基于依存句法分析的事件表示
4.2 事件句的隐式事件因果关系抽取
4.2.1 数据标注方法
4.2.2 基于BERT+Bi-LSTM+Attention+CRF抽取模型
4.3 事件对的隐式事件因果关系抽取
4.3.1 候选事件对
4.3.2 事件间规则特征
4.3.3 结合事件间规则特征和Bi-GRU抽取模型
4.4 因果事件相似度计算
4.5 实验结果与分析
4.6 本章小结
第五章 事理图谱的存储及应用系统设计
5.1 事理图谱的存储
5.1.1 NoSQL数据库介绍
5.1.2 Neo4j图数据库
5.1.3 事理图谱的存储方案设计
5.2 事理图谱应用系统设计
5.2.1 应用系统设计
5.2.2 系统的框架设计
5.2.3 数据查询层设计
5.2.4 业务逻辑层设计
5.3 事理图谱应用功能实现
5.3.1 系统功能介绍
5.3.2 热点话题查询
5.3.3 智能问答功能
5.4 本章小结
第六章 总结与展望
6.1 工作总结
6.2 研究展望
参考文献
攻读学位期间的研究成果
致谢
本文编号:3869514
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3869514.html
最近更新
教材专著