财经领域实体关系抽取技术的研究与系统实现
发布时间:2022-12-11 07:27
财经领域信息蕴含极大价值,分析财经领域信息对指导个人和社会经济活动具有重要意义。但是,财经领域信息数据量大,增长速度快,依靠人工处理费时耗力,难以充分利用这些信息。关系抽取技术可以自动化地抽取自由文本中的实体关系,领域内数据分析人员在抽取出的关系基础上进行数据分析,单位时间内可以分析更多的财经领域信息。因此,本课题的研究可以帮助领域内数据分析人员更加充分地利用财经领域信息,具有重要意义。财经领域信息具有一些明显的领域特点,这些特点导致现有的主流模型在财经领域这个特定领域上,关系抽取的精确率和召回率比较低。首先,财经领域信息句子长度普遍较长。其次,财经领域信息中存在一些单词具有特殊领域含义且与常见含义差别较大,还有一些领域特色的俚语表达。最后,财经领域信息一个句子中包含多个领域实体且不同实体对之间具有不同的关系类型。这篇论文针对以上问题提出了基于BiGRU和Attention机制的联合模型——BGAJM模型(BiGRU Attention Joint Model,BGAJM)。BGAJM模型对以上特点导致的问题,做了针对性改进以提高模型的精确率和召回率。该模型具有以下特点:(1)针对句子...
【文章页数】:91 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 研究背景和意义
1.1.1 研究背景
1.1.2 研究意义
1.2 研究现状部分
1.2.1 财经领域信息利用及关系抽取在其他领域应用的研究现状
1.2.2 关系抽取技术的研究现状
1.2.3 命名实体识别技术的研究现状
1.3 研究内容及创新点
1.3.1 研究内容
1.3.2 论文创新点
1.4 论文的组织结构
第二章 相关技术
2.1 词表示技术
2.1.1 分布式词表示技术
2.2 深度神经网络模型
2.2.1 RNN网络模型
2.2.2 长短期记忆网络模型
2.2.3 基于门结构的循环单元模型
2.3 Attention机制
2.4 本章小结
第三章 财经领域实体关系抽取技术的研究
3.1 财经领域数据特点介绍
3.1.1 句子长度普遍较长
3.1.2 存在具有特殊含义的单词和俚语化表达
3.1.3 句子中包含多个实体且不同实体具有不同的关系
3.2 关系抽取目标
3.3 基于BiGRU和Attention机制的联合模型
3.3.1 词嵌入层
3.3.2 BiGRU层
3.3.3 注意力层
3.3.4 实体识别模块
3.3.5 关系抽取模块
3.4 相关实验及结果分析
3.4.1 数据集介绍
3.4.2 性能评价指标
3.4.3 关系抽取模型超参数实验
3.4.4 分别用BiGRU和BiLSTM作为隐藏层网络模型的对比实验
3.4.5 不同词向量之间的对比实验
3.4.6 不同方法模型之间对比实验
3.5 本章小结
第四章 财经领域信息抽取系统的设计与实现
4.1 需求分析
4.1.1 业务需求
4.1.2 用户需求
4.1.3 功能需求
4.1.4 性能需求
4.2 概要设计
4.2.1 数据库概要设计
4.2.2 系统功能及架构概要设计
4.3 详细设计
4.3.1 数据库表详细设计
4.3.2 功能界面设计
4.4 系统各功能模块实现
4.4.1 用户管理模块
4.4.2 信息爬取模块
4.4.3 实体识别和关系抽取模块
4.5 系统测试
4.5.1 用户管理相关功能测试
4.5.2 信息爬取相关功能测试
4.5.3 关系抽取相关功能测试
4.5.4 系统性能测试
4.6 本章小结
第五章 总结与展望
5.1 论文工作总结
5.2 下一步工作展望
参考文献
致谢
攻读硕士学位期间研究成果
【参考文献】:
期刊论文
[1]基于词汇-语义模式的金融事件信息抽取方法[J]. 罗明,黄海量. 计算机应用. 2018(01)
[2]大数据时代财经报道领域的数据新闻实践[J]. 莫谨榕. 新媒体研究. 2017(13)
[3]网络媒体对股票市场的影响——以东方财富网股吧为例的实证研究[J]. 金雪军,祝宇,杨晓兰. 新闻与传播研究. 2013(12)
[4]中文人称名词短语单复数自动识别[J]. 郎君,秦兵,刘挺,李正华,李生. 自动化学报. 2008(08)
硕士论文
[1]社交数据和股票价格波动关系的研究[D]. 马树东.哈尔滨工业大学 2016
[2]财经网络社区对投资者行为影响的调研报告[D]. 伍韵.浙江大学 2016
[3]财经领域命名实体识别方法的研究与系统实现[D]. 吴阳.哈尔滨工业大学 2015
[4]财经新闻导航:一种新的知识网络框架研究[D]. 周丽丽.中国科学技术大学 2015
[5]财经问答系统问句解析子系统的设计与实现[D]. 林沛坤.哈尔滨工业大学 2014
[6]网络信息对于股票市场的影响[D]. 祝宇.浙江大学 2013
[7]基于网络舆论的我国股票市场有效性检验研究[D]. 陈江鹏.西南财经大学 2013
本文编号:3718380
【文章页数】:91 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 研究背景和意义
1.1.1 研究背景
1.1.2 研究意义
1.2 研究现状部分
1.2.1 财经领域信息利用及关系抽取在其他领域应用的研究现状
1.2.2 关系抽取技术的研究现状
1.2.3 命名实体识别技术的研究现状
1.3 研究内容及创新点
1.3.1 研究内容
1.3.2 论文创新点
1.4 论文的组织结构
第二章 相关技术
2.1 词表示技术
2.1.1 分布式词表示技术
2.2 深度神经网络模型
2.2.1 RNN网络模型
2.2.2 长短期记忆网络模型
2.2.3 基于门结构的循环单元模型
2.3 Attention机制
2.4 本章小结
第三章 财经领域实体关系抽取技术的研究
3.1 财经领域数据特点介绍
3.1.1 句子长度普遍较长
3.1.2 存在具有特殊含义的单词和俚语化表达
3.1.3 句子中包含多个实体且不同实体具有不同的关系
3.2 关系抽取目标
3.3 基于BiGRU和Attention机制的联合模型
3.3.1 词嵌入层
3.3.2 BiGRU层
3.3.3 注意力层
3.3.4 实体识别模块
3.3.5 关系抽取模块
3.4 相关实验及结果分析
3.4.1 数据集介绍
3.4.2 性能评价指标
3.4.3 关系抽取模型超参数实验
3.4.4 分别用BiGRU和BiLSTM作为隐藏层网络模型的对比实验
3.4.5 不同词向量之间的对比实验
3.4.6 不同方法模型之间对比实验
3.5 本章小结
第四章 财经领域信息抽取系统的设计与实现
4.1 需求分析
4.1.1 业务需求
4.1.2 用户需求
4.1.3 功能需求
4.1.4 性能需求
4.2 概要设计
4.2.1 数据库概要设计
4.2.2 系统功能及架构概要设计
4.3 详细设计
4.3.1 数据库表详细设计
4.3.2 功能界面设计
4.4 系统各功能模块实现
4.4.1 用户管理模块
4.4.2 信息爬取模块
4.4.3 实体识别和关系抽取模块
4.5 系统测试
4.5.1 用户管理相关功能测试
4.5.2 信息爬取相关功能测试
4.5.3 关系抽取相关功能测试
4.5.4 系统性能测试
4.6 本章小结
第五章 总结与展望
5.1 论文工作总结
5.2 下一步工作展望
参考文献
致谢
攻读硕士学位期间研究成果
【参考文献】:
期刊论文
[1]基于词汇-语义模式的金融事件信息抽取方法[J]. 罗明,黄海量. 计算机应用. 2018(01)
[2]大数据时代财经报道领域的数据新闻实践[J]. 莫谨榕. 新媒体研究. 2017(13)
[3]网络媒体对股票市场的影响——以东方财富网股吧为例的实证研究[J]. 金雪军,祝宇,杨晓兰. 新闻与传播研究. 2013(12)
[4]中文人称名词短语单复数自动识别[J]. 郎君,秦兵,刘挺,李正华,李生. 自动化学报. 2008(08)
硕士论文
[1]社交数据和股票价格波动关系的研究[D]. 马树东.哈尔滨工业大学 2016
[2]财经网络社区对投资者行为影响的调研报告[D]. 伍韵.浙江大学 2016
[3]财经领域命名实体识别方法的研究与系统实现[D]. 吴阳.哈尔滨工业大学 2015
[4]财经新闻导航:一种新的知识网络框架研究[D]. 周丽丽.中国科学技术大学 2015
[5]财经问答系统问句解析子系统的设计与实现[D]. 林沛坤.哈尔滨工业大学 2014
[6]网络信息对于股票市场的影响[D]. 祝宇.浙江大学 2013
[7]基于网络舆论的我国股票市场有效性检验研究[D]. 陈江鹏.西南财经大学 2013
本文编号:3718380
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3718380.html
最近更新
教材专著