基于开放知识图谱的金属材料领域问答系统研究

发布时间:2021-06-01 08:05
  目前,问答已经被应用于很多特定的领域,比如医药领域和地理领域等。随着开放知识图谱中实体和关系的不断丰富,开放知识图谱可以为领域问答提供更丰富的信息。然而,基于开放知识图谱的领域信息查询仍面临一些挑战,其中的数据未指明其所属的领域,而且用户的自然语言查询和知识图谱中的数据在结构上不一致。本文提出了一种基于开放知识图谱的特定领域问答研究方法,该方法设计了一系列逻辑规则将用户问题的语义解析结果转化为问题三元组;再根据WordNet和Microsoft Concept Graph对问题三元组中的概念进行多语义角度的扩展;基于概念的语义扩展结果实现问题三元组的语义扩展;再将扩展后的问题三元组和开放知识图谱中的领域数据建立匹配关系。本课题所做的主要贡献如下:1)设计逻辑规则将问题转化为结构化表示。使用自然语言处理工具Stanford Parser和Stanford CoreNLP对用户问题进行解析,再根据所设计的规则将解析结果整合为三元组表示,从而实现问题的结构化表示。2)设计语义查询扩展策略和扩展结果过滤策略以进行查询扩展。基于WordNet和Microsoft Concept Graph对问题... 

【文章来源】:河北科技大学河北省

【文章页数】:81 页

【学位级别】:硕士

【部分图文】:

基于开放知识图谱的金属材料领域问答系统研究


基于知识图谱的领域问答流程图

问题结构,表示方法


10规则(Rules)将依存关系转化为问题三元组(Question Triple)。图3-1 基于规则的问题结构化表示方法图3.2 相关概念描述使用Stanford CoreNLP解析一个自然语言句子可以得到该句子中所包含词的标记信息,如:POS标记,Lemma标记和NER标记等。在本课题中,所使用的NER标记有:LOCATION、PERSON、ORGANIZATION和DATE,它们分别表示位置名称、人物名称、组织机构名称和日期,具体介绍如附录A表1所示。所用到的POS标记有:表示名词的NN、NNS、NNP和NNPS等;表示动词的VB、VBD、VBP、VBZ等;表示形容词的JJ等、表示疑问词的WDT和WP等;表示连词的CC等;表示数词的CD等;表示限定词的DT;表示介词的IN、TO等,具体介绍如附录A表2所示。对于问题“Whichiron bridge is constructed by Squire Whipple?”,其语义标记如图3-2所示。

语义标记,问题,数词,限定词


形容词的JJ等、表示疑问词的WDT和WP等;表示连词的CC等;表示数词的CD等;表示限定词的DT;表示介词的IN、TO等,具体介绍如附录A表2所示。对于问题“Whichiron bridge is constructed by Squire Whipple?”,其语义标记如图3-2所示。图3-2 对问题中的词进行语义标记

【参考文献】:
期刊论文
[1]基于向量空间模型结合语义的文本相似度算法[J]. 冯高磊,高嵩峰.  现代电子技术. 2018(11)
[2]基于知网与词林的词语语义相似度计算[J]. 朱新华,马润聪,孙柳,陈宏朝.  中文信息学报. 2016(04)
[3]基于抽取规则和本体映射的领域XML语义集成[J]. 李华昱,张培颖,肖晗.  河北科技大学学报. 2016(04)
[4]基于用户兴趣的多属性效用算法的研究[J]. 勾智楠.  河北工业科技. 2012(02)
[5]基于语义相似度的数据库自适应查询松弛方法[J]. 孟祥福,严丽,马宗民,张富,王星.  计算机学报. 2011(05)



本文编号:3210003

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3210003.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户6362c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com