EVSR:一种用于提取并可视化文本类学习资源中语义关系的技术框架
发布时间:2021-03-11 11:44
文本信息抽取指的是在具有指定实体类别的文本实例中找出目标实体和语义关系的过程。虽然知识抽取在自然语言处理领域获得了长足的发展,并已有一些知识抽取工具或系统可用于关系抽取,但是大多数工具和系统抽取的结果由于不满足领域知识约束而缺乏可用性。现有的知识抽取系统无法直接应用于教育领域的知识图自动生成。因此本文提出了一个用于提取并可视化文本类学习资源中认知价值语义关系的技术框架EVSR,它是由带条件随机场层的双向长短期记忆神经网络(Bidirectional Long Short-Term Memory,BiLSTM-CRF)和分段卷积神经网络(Piecewise Convolutional Neural Networks,PCNN)实现的。在EVSR中,BiLSTM-CRF模型用于提取语义实体,PCNN模型用于识别语义关系。本文还实现了EVSR的原型系统,系统可以识别出文本类学习资源中的语义关系实体对。语义关系实体对经过合并、推理等操作可以生成一个语义链网络(Sematic Link Network,SLN)。最后SLN可以以概念图的形式可视化。本文还在准确率,适应性等方面将这两个模型与前期研...
【文章来源】:四川师范大学四川省
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
知识表征在各个领域的含义[39]
关系,其含义是指存在自然语言文本中,对学生的学习、认知具有帮助的信息。体现在文本中是一些相关的知识点、概念、概念的定义、解释说明、举例等,这些语义关系有助于培养学生的知识整合能力。知识抽取和可视化的基础是通过文本中的一些线索(如关键词“包括”、“定义”、“代表着”、“指的是”、“例如”等)找到这些具有认知价值的信息,并且提取出来,形成结构化的资源,如一个语义链接的形式<语义节点1,关系,语义节点2>,其中语义节点可以是一个概念或是与概念相关的文本文本片段,本文将其称为虚拟概念实体。如图2.2可以抽取出实例关系的SLN<‘例如:inti,j,k’,exampleof,变量表>。图2.2虚拟概念实体[47]本文的前期研究在线学习资源构建模型[47]中,为不同的学习场景构建不同种类的资源关系,但是在实际分析过程中存在语义关系定义不明确,虚拟概念实体识别困难,判断实体间关系困难的问题,因此本文在已有的语义关系的基础上,更加明确了语义关系的定义,扩展了语义关系的种类,使得标注和机器识别都能够更加准确和清楚。根据关系的有向性,本文将语义关系分为5个双向相等关系和14个双向不等关系,语义关系的含义如表2.1所示:
3知识抽取和可视化技术框架EVSR153知识抽取和可视化技术框架EVSR3.1EVSR技术框架结构与概述本文的研究目的在于提出一个知识抽取和可视化技术框架EVSR,并进行实例系统开发。EVSR框架的结构如图3.1所示,框架从下到上依次是原子层、语义链网络层和展示层。最底层是原子层,主要由两个知识抽取模块构成,分别是语义实体识别模块和语义关系识别模块。在语义实体识别模块,本文使用经过标注和向量化的文本数据来训练一个BiLSTM-CRF神经网络模型,实现语义实体抽取的功能。语义关系识别模块主要包括一个PCNN神经网络模型,用于抽取文本中语义关系对。语义链网络层是一个虚拟概念层,数据库查询的结果和底层模型的识别结果都需要合并且生成一个语义链网络后,再由前端页面可视化。展示层包括交互界面和数据库,交互界面为用户提供服务和交互,数据库中用于存放语义实体和语义实体对之间的关系,形成知识库。图3.1知识可视化技术框架EVSR结构图3.2语义实体识别模块语义实体识别模块的主要功能有两个,一是训练一个语义实体识别神经网络模型BiLSTM-CRF,二是利用BiLSTM-CRF模型识别文本中的语义实体。模块的输入为非结构化的自然语言文本,输出是语义实体。
【参考文献】:
期刊论文
[1]关系抽取综述[J]. 谢德鹏,常青. 计算机应用研究. 2020(07)
[2]面向中文开放领域的多元实体关系抽取研究[J]. 姚贤明,甘健侯,徐坚. 智能系统学报. 2019(03)
[3]基于数学教学的知识图谱构建[J]. 戈其平,钟艳如. 计算机技术与发展. 2019(03)
[4]《机器学习》[J]. 周志华. 航空港. 2018(02)
[5]基于深度学习的中文实体关系抽取方法[J]. 孙紫阳,顾君忠,杨静. 计算机工程. 2018(09)
[6]可演化的个人知识图建构及认知评估模型研究[J]. 赵德芳,朱梦梦,杨娟. 现代远程教育研究. 2017(02)
[7]文本蕴含关系识别与知识获取研究进展及展望[J]. 郭茂盛,张宇,刘挺. 计算机学报. 2017(04)
[8]基于依存分析的开放式中文实体关系抽取方法[J]. 李明耀,杨静. 计算机工程. 2016(06)
[9]面向中文自然语言文档的自动知识抽取方法[J]. 车海燕,冯铁,张家晨,陈伟,李大利. 计算机研究与发展. 2013(04)
[10]知识可视化在计算机教学中的应用[J]. 姜世华,陈新红,梁鹏. 东北农业大学学报(社会科学版). 2012(02)
硕士论文
[1]自规律学习平台中基于语义链网络的知识可视化研究[D]. 赵德芳.四川师范大学 2019
[2]“概念图教学策略”在高中生物学教学中的实践研究[D]. 赵映红.四川师范大学 2018
[3]在线学习系统中知识构建及应用研究[D]. 朱梦梦.四川师范大学 2018
[4]学科知识的可视化技术研究与实现[D]. 张亚龙.电子科技大学 2016
本文编号:3076401
【文章来源】:四川师范大学四川省
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
知识表征在各个领域的含义[39]
关系,其含义是指存在自然语言文本中,对学生的学习、认知具有帮助的信息。体现在文本中是一些相关的知识点、概念、概念的定义、解释说明、举例等,这些语义关系有助于培养学生的知识整合能力。知识抽取和可视化的基础是通过文本中的一些线索(如关键词“包括”、“定义”、“代表着”、“指的是”、“例如”等)找到这些具有认知价值的信息,并且提取出来,形成结构化的资源,如一个语义链接的形式<语义节点1,关系,语义节点2>,其中语义节点可以是一个概念或是与概念相关的文本文本片段,本文将其称为虚拟概念实体。如图2.2可以抽取出实例关系的SLN<‘例如:inti,j,k’,exampleof,变量表>。图2.2虚拟概念实体[47]本文的前期研究在线学习资源构建模型[47]中,为不同的学习场景构建不同种类的资源关系,但是在实际分析过程中存在语义关系定义不明确,虚拟概念实体识别困难,判断实体间关系困难的问题,因此本文在已有的语义关系的基础上,更加明确了语义关系的定义,扩展了语义关系的种类,使得标注和机器识别都能够更加准确和清楚。根据关系的有向性,本文将语义关系分为5个双向相等关系和14个双向不等关系,语义关系的含义如表2.1所示:
3知识抽取和可视化技术框架EVSR153知识抽取和可视化技术框架EVSR3.1EVSR技术框架结构与概述本文的研究目的在于提出一个知识抽取和可视化技术框架EVSR,并进行实例系统开发。EVSR框架的结构如图3.1所示,框架从下到上依次是原子层、语义链网络层和展示层。最底层是原子层,主要由两个知识抽取模块构成,分别是语义实体识别模块和语义关系识别模块。在语义实体识别模块,本文使用经过标注和向量化的文本数据来训练一个BiLSTM-CRF神经网络模型,实现语义实体抽取的功能。语义关系识别模块主要包括一个PCNN神经网络模型,用于抽取文本中语义关系对。语义链网络层是一个虚拟概念层,数据库查询的结果和底层模型的识别结果都需要合并且生成一个语义链网络后,再由前端页面可视化。展示层包括交互界面和数据库,交互界面为用户提供服务和交互,数据库中用于存放语义实体和语义实体对之间的关系,形成知识库。图3.1知识可视化技术框架EVSR结构图3.2语义实体识别模块语义实体识别模块的主要功能有两个,一是训练一个语义实体识别神经网络模型BiLSTM-CRF,二是利用BiLSTM-CRF模型识别文本中的语义实体。模块的输入为非结构化的自然语言文本,输出是语义实体。
【参考文献】:
期刊论文
[1]关系抽取综述[J]. 谢德鹏,常青. 计算机应用研究. 2020(07)
[2]面向中文开放领域的多元实体关系抽取研究[J]. 姚贤明,甘健侯,徐坚. 智能系统学报. 2019(03)
[3]基于数学教学的知识图谱构建[J]. 戈其平,钟艳如. 计算机技术与发展. 2019(03)
[4]《机器学习》[J]. 周志华. 航空港. 2018(02)
[5]基于深度学习的中文实体关系抽取方法[J]. 孙紫阳,顾君忠,杨静. 计算机工程. 2018(09)
[6]可演化的个人知识图建构及认知评估模型研究[J]. 赵德芳,朱梦梦,杨娟. 现代远程教育研究. 2017(02)
[7]文本蕴含关系识别与知识获取研究进展及展望[J]. 郭茂盛,张宇,刘挺. 计算机学报. 2017(04)
[8]基于依存分析的开放式中文实体关系抽取方法[J]. 李明耀,杨静. 计算机工程. 2016(06)
[9]面向中文自然语言文档的自动知识抽取方法[J]. 车海燕,冯铁,张家晨,陈伟,李大利. 计算机研究与发展. 2013(04)
[10]知识可视化在计算机教学中的应用[J]. 姜世华,陈新红,梁鹏. 东北农业大学学报(社会科学版). 2012(02)
硕士论文
[1]自规律学习平台中基于语义链网络的知识可视化研究[D]. 赵德芳.四川师范大学 2019
[2]“概念图教学策略”在高中生物学教学中的实践研究[D]. 赵映红.四川师范大学 2018
[3]在线学习系统中知识构建及应用研究[D]. 朱梦梦.四川师范大学 2018
[4]学科知识的可视化技术研究与实现[D]. 张亚龙.电子科技大学 2016
本文编号:3076401
本文链接:https://www.wllwen.com/jiaoyulunwen/ktjx/3076401.html