当前位置:主页 > 科技论文 > 搜索引擎论文 >

事件知识图谱平台设计及实现

发布时间:2021-08-31 04:53
  知识图谱是以实体作为顶点,实体间关联作为边,描述静态知识,但现实世界中知识是动态变化的,记叙文是记录动态知识的主要载体。针对记叙文的知识化抽取,本文设计并实现了一个事件知识图谱平台,能够将知识从非结构化文本形式转化成以事件为单元的图谱形式,描述现实世界中事物之间的关联。事件知识图谱平台由数据采集平台、图谱构建平台、并行计算平台及标注平台组成。数据采集平台负责从互联网中获取指定事件相关的新闻文本、追踪热点事件、自动更新数据。图谱构建平台将事件信息从文本形式转化为图谱形式。并行计算平台提供并行计算能力,承载图谱构建过程中的计算任务。标注平台为标注人员和行业专家提供规则制定和样本标注作业平台,确保平台能够适应不同的业务场景。平台的主要工作流程分为文本数据采集、元事件抽取及融合、事件知识图谱构建及可视化。首先通过数据采集平台获取事件相关文本,再利用自然语言处理技术分析文本,从中抽取元事件信息,然后对元事件信息进行整理和融合,最后将事件组织为图谱形式,完成事件知识图谱构建,实现将知识转化为以事件为核心的图谱形式。本文的研究成果包括以下四点:(1)针对数据采集时可能出现搜索不准确导致结果中出现无关... 

【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校

【文章页数】:86 页

【学位级别】:硕士

【部分图文】:

事件知识图谱平台设计及实现


隐马尔可夫模型结构示意图

训练模型


电子科技大学硕士学位论文2.2.3 word2vectorword2vector 是一种将词或者字转换为向量表示的工具。词向量之间余弦距离的表示词之间的相似性:余弦值越大,两个向量在空间中夹角越小,两个词词义越接近;余弦值越小,两个向量在空间中夹角越大,两个词的词义越疏远。和传统的统计特征相比,word2vector 解决了词向量高维稀疏的问题,同时能够利用词向量相似性表示语义相似性。这一转换为文本进行语义计算奠定了基础,也促进了神经网络在自然语言处理领域的应用。根据语言模型的不同,分为连续词袋模型(Continuous Bag-of-Word Model,CBOW)和“Skip-gram”模型[35],前者是用语境来预测目标单词,后者是用中心单词来预测语境。训练 word2vector 时还有两种优化方法:层次 softmax 和负采样。word2vector 模型结构如图 2-2 所示,图中 C(wt)表示词 wt对应的向量。

结构图,随机场,线性链,条件


第二章 相关理论与技术基础 2.1 令无向图 G {V ,E},v v VY Y ( ) ,Y 中的元素与无向图中X 为观测序列,Y 为状态序列。在 X 已知的情况下,如果Y 中任尔可夫性,即~v w v wP( Y |X ,Y , w v) = P( Y |X ,Y , w v) P (Y | X )是一个条件随机场。其中 w~v,表示在无向图中,(点。链条件随机场(Linear Chain Conditional Random Field)是条件1 2{ , ,...,}n X X X表示观测值, 1 2, ,...,nY Y Y Y表示隐藏状态值,一对应。在线性条件随机场的概率转换图中,最大团节点数为节点。结构如图 2-3 所示。

【参考文献】:
期刊论文
[1]基于电商数据的产品知识图谱构建研究[J]. 丁晟春,侯琳琳,王颖.  数据分析与知识发现. 2019(03)
[2]基于LSTM网络的序列标注中文分词法[J]. 任智慧,徐浩煜,封松林,周晗,施俊.  计算机应用研究. 2017(05)
[3]知识表示学习研究进展[J]. 刘知远,孙茂松,林衍凯,谢若冰.  计算机研究与发展. 2016(02)
[4]知识图谱的技术实现流程及相关应用[J]. 曹倩,赵一鸣.  情报理论与实践. 2015(12)
[5]知识组织中知识粒度化表示和规范化研究[J]. 徐绪堪,房道伟,蒋勋,苏新宁.  图书情报知识. 2014(06)
[6]开放式信息抽取研究进展[J]. 杨博,蔡东风,杨华.  中文信息学报. 2014(04)
[7]基于密度的改进BIRCH聚类算法[J]. 韦相.  计算机工程与应用. 2013(10)
[8]一种基于密度的聚类算法实现[J]. 段明秀,唐超琳.  吉首大学学报(自然科学版). 2013(01)
[9]网格聚类算法研究[J]. 李爱华,尹斐斐.  科技致富向导. 2012(23)
[10]数据挖掘中聚类算法研究进展[J]. 周涛,陆惠玲.  计算机工程与应用. 2012(12)

硕士论文
[1]一种改进的COBWEB算法研究[D]. 于洋.哈尔滨工程大学 2010
[2]基于最大熵模型的汉语词性标注研究[D]. 张磊.大连理工大学 2008



本文编号:3374232

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3374232.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户19873***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com