面向文本数据的金融实体关系挖掘技术研究
发布时间:2021-06-08 11:18
随着大数据、人工智能等技术的快速发展,数据驱动下的智能化浪潮给金融业的发展带来了新的创新机遇和商业模式。目前,金融领域每天都会产生大量不同形式的互联网文本数据。如何准确、高效地挖掘这些金融文本中的重要信息,以提升金融服务效率是金融智能化面临的一个关键问题。本文主要研究金融信息挖掘中的核心任务-实体关系抽取任务。该任务的目标是从文本数据中识别出金融实体,并判断实体间存在的语义关系。通过对实体关系抽取方法进行调研,本文从管道式和联合式实体关系抽取两个方面进行探索,分析现有工作存在的不足和缺陷,有针对性地提出相应的改进方法,以此来更好地提升实体关系抽取任务的性能。具体来说,本文主要贡献有以下几个方面:1.对现有的管道式和联合式实体关系抽取方法进行调研,整理和总结相关方法的研究现状,分析现有工作存在的不足与缺陷。2.在管道式实体关系抽取方面,针对模型语义关系信息利用不充分问题,提出一种基于实体子序列增强与实体依赖注意力的关系抽取模型,该模型通过进一步单独编码输入句子的实体间子序列来增强其对实体子序列信息的关注和利用,并保留原始长句信息;在模型特征融合层引入实体依赖注意力,引导模型更多地关注与实...
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:85 页
【学位级别】:硕士
【部分图文】:
金融关系数据集句子长度分布
LSTM网络单元结构
不同语义关系类别的F1值分布情况
【参考文献】:
期刊论文
[1]基于深度神经网络的网络安全实体识别方法[J]. 秦娅,申国伟,赵文波,陈艳平. 南京大学学报(自然科学). 2019(01)
[2]融入自注意力机制的社交媒体命名实体识别[J]. 李明扬,孔芳. 清华大学学报(自然科学版). 2019(06)
[3]基于CRF和BI-LSTM的命名实体识别方法[J]. 柏兵,侯霞,石松. 北京信息科技大学学报(自然科学版). 2018(06)
[4]开放式地理实体关系抽取的Bootstrapping方法[J]. 余丽,陆锋,刘希亮. 测绘学报. 2016(05)
[5]基于句法语义特征的中文实体关系抽取[J]. 甘丽新,万常选,刘德喜,钟青,江腾蛟. 计算机研究与发展. 2016(02)
[6]基于CRF和规则相结合的地理命名实体识别方法[J]. 何炎祥,罗楚威,胡彬尧. 计算机应用与软件. 2015(01)
[7]基于特征组合的中文实体关系抽取[J]. 黄鑫,朱巧明,钱龙华,刘梅梅. 微电子学与计算机. 2010(04)
本文编号:3218335
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:85 页
【学位级别】:硕士
【部分图文】:
金融关系数据集句子长度分布
LSTM网络单元结构
不同语义关系类别的F1值分布情况
【参考文献】:
期刊论文
[1]基于深度神经网络的网络安全实体识别方法[J]. 秦娅,申国伟,赵文波,陈艳平. 南京大学学报(自然科学). 2019(01)
[2]融入自注意力机制的社交媒体命名实体识别[J]. 李明扬,孔芳. 清华大学学报(自然科学版). 2019(06)
[3]基于CRF和BI-LSTM的命名实体识别方法[J]. 柏兵,侯霞,石松. 北京信息科技大学学报(自然科学版). 2018(06)
[4]开放式地理实体关系抽取的Bootstrapping方法[J]. 余丽,陆锋,刘希亮. 测绘学报. 2016(05)
[5]基于句法语义特征的中文实体关系抽取[J]. 甘丽新,万常选,刘德喜,钟青,江腾蛟. 计算机研究与发展. 2016(02)
[6]基于CRF和规则相结合的地理命名实体识别方法[J]. 何炎祥,罗楚威,胡彬尧. 计算机应用与软件. 2015(01)
[7]基于特征组合的中文实体关系抽取[J]. 黄鑫,朱巧明,钱龙华,刘梅梅. 微电子学与计算机. 2010(04)
本文编号:3218335
本文链接:https://www.wllwen.com/guanlilunwen/huobilw/3218335.html