基于深度学习的结构化数据问答方法研究

发布时间:2021-10-21 07:32
  随着通信技术的发展和计算机软硬件性能的提升,人们越来越多地使用互联网发布各种信息,并留存下了海量数据。其中的一部分是结构化数据,例如知识图谱和表格。结构化数据是依照某种数据模型以自动和人工手段结合构建的,具有数据量丰富、质量高和有结构的特点,非常适合做问答系统的知识源。使用结构化数据回答问题的一种主要手段是语义解析,即将自然语言问题通过计算机程序映射为具有相同含义的SPARQL、SQL等结构化查询语句。传统语义解析方法基于模板,仅能覆盖少部分查询结构对应的问题。基于语法或句法分析的方法需要人工编制结构的组合或映射规则,且对不标准问句常常遇到结构不匹配的问题。机器学习方法可以自动从问题-查询或问题-答案标注数据中学习转换规则,但依靠人工经验设计的特征难以捕捉一些关键信息。近几年,深度学习飞速发展,基于该技术的方法在多个自然语言处理任务上取得了良好效果。深度学习能自动提取问题和查询的最佳匹配特征,在新的问题模式和查询结构上泛化能力强,对结构化数据问答任务很有帮助。虽然国内外研究人员已经在基于深度学习的结构化数据问答上取得一定成果,但现有成果在查询表示方法和问题-查询匹配方法上仍存在不足。因... 

【文章来源】:北京邮电大学北京市 211工程院校 教育部直属院校

【文章页数】:106 页

【学位级别】:博士

【部分图文】:

基于深度学习的结构化数据问答方法研究


图1-2?Freebase中与Natalie?Portman相关的知识图谱片段??Freebase有以下几个值得关注的特点:第一,每个实体拥有独一无二的id

模式图,匹配模型,实体,问题


。如果完全重合,将相应实体作为候选实体,如??果部分重合,取尤个连续重合长度最长的实体作为候选实体。??3.2.2.3查询遍历??获得候选实体后,查询它们每一个作为头实体形成的事实,将这些事实中的??尾实体去掉,再将不重复的“头实体-关系”连接保存,就得到了候选查询。需要??注意的是,Freebase在表示一个有多方参与的事实时会加入虚拟节点,即1.2.1小??节中介绍的CVT。这时需要扩展一跳关系,将一个头实体和连续的两个关系作??为候选查询。??3.2.3问题-查询匹配??图3-1展示了我们提出的整个问题-查询匹配模型,下面将首先介绍模型整体??设计思路,然后对编码器和解码器的细节进行介绍。??QUeStk>nq?;?,,?U?i?r?■?I?-?Target?vocabulary?.??what?position?does?messi?generate?'^?,?l-??义国?!#,S0Ufcesvmb0ls?…??■?paraphrase、、;抑*?丨1?顏…ITl?Entity?lexicon??''卞?|;|?I?|-I|?…[Relation?lexicon??attention?^?'w??Subjecl-reiation?p3ir?a?<^-****^**::^r^??t?t?t?t?::??<bs>?lionel?messi?<es>?<br>?soccer?football?player?position?s?<er>?1??图3-1联合生成、复制和改写模式的问题-查询匹配模型??32??

知识图,片段


北京邮电大学博士学位论文???如图4-1,如果我们将实体视为点,关系视为边,那么知识图谱是一张图而查询??可以视为其中的一个子图(红色部分)。需要思考的是,查询是有结构的,这种??结构是将实体和关系组织起来的特定顺序,而顺序直接影响整个查询的含义,不??同的顺序引出不同的含义。因此我们需要对查询结构进行建模,以更好捕捉查询??的语义,实现对不同查询的有效区分。??\?Portman?J?\?J?\?Amidala?]??\?\nationality?n.?starring??v?09?y?\MmeP,w?v"?y??图4-1知识图谱片段和复杂查询子图??知识图谱复杂关系问答有丰富的历史。早期方法主要基于模板,这些方法人??工标注或自动学习从问题模式到查询骨架的映射,因而对查询结构进行了建模。??然而模板仅能覆盖少量查询结构且泛化能力较差。基于机器学习的方法依靠简单??的规则生成候选查询,并从问题和查询中提取启发式特征从而对候选排序。然而,??这些简单的特征不能很好地表达查询结构。当前,相关方法己主要采用深度学习??技术。它们首先从问题中识别一个主题实体,然后将它连接的一到两跳关系作为??核心关系链与问题进行匹配,最后将约束添加进匹配到的关系链中。然而,由于??这些方法在匹配过程中使用的是关系链而不是完整的查询,因而几乎没有对查询??结构进行建模。??本章中,我们提出将候选查询的结构信息编码到其嵌入表示中,从而增强与??给定问题的匹配效果。整体上,先对给定问题进行实体、类型和数字操作的链接,??并以这些链接结果为约束构造候选查询,然后将每个候选查询与问题进行匹配。??在候选查询的生成过程中,我们注意到


本文编号:3448528

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/3448528.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户0e156***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com