基于深度学习的信息抽取技术研究
发布时间:2021-03-15 01:57
信息抽取(Information Extraction)技术是指从非结构化数据当中提取用户感兴趣的信息,形成结构化的存储或提供即时检索功能的技术。最近几年来随着深度学习技术的快速发展,信息抽取技术产生了突破性的进展。本文通过对近几年面向自然语言处理的深度学习技术的深入探究,从弱监督关系抽取和机器阅读理解两个方向对基于深度学习的信息抽取技术进行研究,提出改进算法,并构建云服务场景下的原型系统。在弱监督关系抽取方面,本文通过分析从句子当中提取关系信息的难点,提出多路径卷积神经网络算法,通过改进网络的结构,增强算法的准确性。实验证明,改进后的弱监督关系抽取模型在准确率、召回率上相比现有算法均有比较明显的提升。在机器阅读理解方面,本文基于目前已有的方法对于一个问题仅提取一个单一答案的特点,通过改进答案选取机制和损失函数的形式设计多重答案机器阅读理解算法,使得算法可以自动提取多个不相关的可行答案,拓展了机器阅读理解算法的功能。实验证明,改进的多答案机器阅读理解算法可以在保持对单一答案提取的准确性的同时较好的解决多重答案选取的问题。最后,本文基于深度学习框架和网络服务框架实现了云服务场景下的深度学...
【文章来源】:国防科技大学湖南省 211工程院校 985工程院校
【文章页数】:76 页
【学位级别】:硕士
【部分图文】:
深度学习信息抽取系统的结构
语料序列与外部特征的聚合如图2所示,对于从数据集中获取的文字序列,算法首先对文章进行分词处
神经网络编码器-循环神经网络
本文编号:3083354
【文章来源】:国防科技大学湖南省 211工程院校 985工程院校
【文章页数】:76 页
【学位级别】:硕士
【部分图文】:
深度学习信息抽取系统的结构
语料序列与外部特征的聚合如图2所示,对于从数据集中获取的文字序列,算法首先对文章进行分词处
神经网络编码器-循环神经网络
本文编号:3083354
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3083354.html