基于语义图的中文领域概念及关系抽取方法研究与实现

发布时间:2021-07-31 04:22
  随着互联网技术的飞速发展,数据量在不断递增,从海量数据中挖掘有效信息变得越来越重要。在这个过程中知识图谱,特别是领域知识图谱发挥了重要的作用,成为互联网知识驱动智能应用的基础设施。对于领域知识图谱的构建,首先应该构建知识图谱的数据模式。由于领域数据的庞大性,且大部分是非结构化文本,因而自动构建知识图谱的数据模式成为该领域研究的重点。领域术语的抽取、领域概念的抽取以及关系的抽取是构建知识图谱数据模式的重要因素。本文针对知识图谱数据模式的构建进行了以下三个方面的研究。1)采用了基于混合策略的中文领域术语抽取方法。首先对领域数据集进行词法分析,基于规则进行候选领域术语的抽取;其次使用统计的方法对候选领域术语进行过滤,利用TF-IDF算法进行领域术语的抽取,利用TextRank算法进行单词术语多词术语的抽取。实验结果表明,该方法使得领域术语的抽取较为全面。2)提出了基于语义图的中文领域概念抽取方法。该方法针对领域术语,构建包含语义信息的术语语义图,使用社区发现算法对术语语义图进行分析和划分,从而实现概念抽取。实验结果表明,该方法能够有效利用语义信息获得较好的概念抽取结果。3)提出了一种基于语义... 

【文章来源】:河北科技大学河北省

【文章页数】:75 页

【学位级别】:硕士

【部分图文】:

基于语义图的中文领域概念及关系抽取方法研究与实现


CBOW模型架构

语义图,网站


语义图

句法结构


依存句法结构


本文编号:3312759

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3312759.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户18665***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com