基于图的中文集成实体链接算法
本文选题:集成实体链接 + 知识库扩容 ; 参考:《计算机研究与发展》2016年02期
【摘要】:实体链接(entity linking)是知识库扩容的核心关键技术,传统的实体链接方法通常受制于本地知识库的知识水平,而且忽略共现实体间的语义相关性.提出了一种基于图的中文集成实体链接方法,不仅能够充分利用知识库中实体间的结构化关系,而且能够通过增量证据挖掘获取外部知识,从而实现对同一文本中出现的多个歧义实体的批量实体链接.在开放域公开测试语料上的实验结果表明,所提出的实体相关图构造方法、增量证据挖掘方法和实体语义一致性判据是有效的,算法整体性能一致且显著地优于当前的主流算法.
[Abstract]:Entity link (entity linking) is the key technology of knowledge base expansion. The traditional entity link method is usually restricted by the knowledge level of the local knowledge base and neglects the semantic correlation between the co-realistic bodies. In this paper, a graph-based Chinese integrated entity link method is proposed, which can not only make full use of the structured relationships among entities in the knowledge base, but also acquire external knowledge through incremental evidence mining. In order to realize the batch entity link to the multiple ambiguous entities that appear in the same text. Experimental results on open domain open test corpus show that the proposed method of entity correlation graph construction, incremental evidence mining and entity semantic consistency criterion are effective. The overall performance of the algorithm is consistent and significantly superior to the current mainstream algorithm.
【作者单位】: 电子科技大学信息与软件工程学院;
【基金】:国家自然科学基金项目(61133016,61272527,61202445) 教育部-中国移动科研基金项目(MCM20121041) 中央高校基本科研业务费专项资金(ZYGX2014J066)~~
【分类号】:TP391.1
【相似文献】
相关期刊论文 前10条
1 吴克忠;;中文信息技术的创新与发展(下)[J];办公自动化;2003年07期
2 ;《中文信息学报》征稿简则[J];中文信息学报;2011年02期
3 ;《中文信息学报》征稿简则[J];中文信息学报;2011年06期
4 ;《中文信息学报》征稿简则[J];中文信息学报;2012年01期
5 ;《中文信息学报》征稿简则[J];中文信息学报;2013年04期
6 ;《中文信息》已于十月创刊[J];微计算机应用;1984年04期
7 阎久佐;;我校首创“计算机中文信息库”[J];北京师范大学学报(自然科学版);1985年04期
8 ;中文系统的诞生、发展和使命[J];电脑技术;1995年03期
9 ;加快中文信息研究和建设——国家语委纪念文字改革和汉语规范化40周年 李岚清副总理提出当前应重点抓好三项工作[J];中文信息;1996年02期
10 袁诚;关于中文软件的思考[J];上海微型计算机;1996年21期
相关会议论文 前6条
1 刘春荣;;我国当务之急是解决中文书写方式的根本变革[A];中国中文信息学会汉字编码专业委员会第九届年会暨学术研讨会论文集[C];2011年
2 陈晓鸥;;从中文电子出版到中文电子传播[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
3 董强;郝长伶;董振东;;基于《知网》的中文语块抽取器[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
4 王春元;张韬;;一种获取网页主要中文信息的方法[A];全国计算机安全学术交流会论文集(第二十四卷)[C];2009年
5 ;中文信息的智能处理[A];中国中文信息学会第六次全国会员代表大会暨成立二十五周年学术会议中文信息处理重大成果汇报展资料汇编[C];2006年
6 宋彦;黄昌宁;揭春雨;;中文CCG树库的构建[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
相关重要报纸文章 前2条
1 侯雪林;自主创新 迎接拼字文明时代到来[N];大众科技报;2007年
2 安徽 张来东;在JAVA开发中的中文处理问题及解决办法[N];中国计算机报;2001年
相关博士学位论文 前3条
1 丁凯;基于增量学习的中文手写书写者自适应技术研究[D];华南理工大学;2011年
2 张海军;基于大规模语料的中文新词识别技术研究[D];中国科学技术大学;2011年
3 张紫琼;在线中文评论情感分类问题研究[D];哈尔滨工业大学;2010年
,本文编号:2082287
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2082287.html