一种基于概率主题模型的命名实体链接方法
发布时间:2017-09-20 01:41
本文关键词:一种基于概率主题模型的命名实体链接方法
【摘要】:命名实体链接(named entity linking,简称NEL)是把文档中给定的命名实体链接到知识库中一个无歧义实体的过程,包括同义实体的合并、歧义实体的消歧等.该技术可以提升在线推荐系统、互联网搜索引擎等实际应用的信息过滤能力.然而,实体数量的激增给实体消歧等带来了巨大挑战,使得当前的命名实体链接技术越来越难以满足人们对链接准确率的要求.考虑到文档中的词和实体往往具有不同的语义主题(如"苹果"既能表示水果又可以是某电子品牌),而同一文档中的词与实体应当具有相似的主题,因此提出在语义层面对文档进行建模和实体消歧的思想.基于此设计一种完整的、基于概率主题模型的命名实体链接方法.首先,利用维基百科(Wikipedia)构建知识库;然后,利用概率主题模型将词和命名实体映射到同一个主题空间,并根据实体在主题空间中的位置向量,把给定文本中的命名实体链接到知识库中一个无歧义的命名实体;最后,在真实的数据集上进行大量实验,并与标准方法进行对比.实验结果表明:所提出的框架能够较好地解决了实体歧义问题,取得了更高的实体链接准确度.
【作者单位】: 中国科学技术大学计算机科学与技术学院;
【关键词】: 命名实体链接 概率主题模型 维基百科
【基金】:国家杰出青年科学基金(61325010) 国家高技术研究发展计划(863)(2014AA015203) 安徽省科技专项资金(13Z02008-5) 安徽省国际科技合作计划(1303063008) 安徽省科技攻关计划(1301022064) 安徽省自然科学基金(1408085QF110)
【分类号】:TP391.1
【正文快照】: 人们在使用互联网的过程中,接触频率最高的信息载体就是文字信息,如新闻、博客、评论等,这些文本蕴含了大量的命名实体(named entity).所谓命名实体,即包括名称(组织名、人名、地名、商品名)、表达式(日期、时间)等在内的具有明确语义信息的文本实体[1].为此,许多学者专注于研
【相似文献】
中国期刊全文数据库 前10条
1 谭红叶;赵铁军;;一种基于软模式的语义类发现方法[J];哈尔滨工业大学学报;2007年11期
2 刘路;李弼程;张先飞;;基于向量相似度修正策略的命名实体关联分析[J];计算机工程与应用;2008年02期
3 潘渊;李弼程;张先飞;;一种基于自适应重心向量的主题检测方法[J];计算机工程;2009年03期
4 潘正高;侯传宇;谈成访;;基于命名实体的Web新闻文本分类方法[J];合肥工业大学学报(自然科学版);2011年08期
5 王睿,张洁,张由仪,于y,
本文编号:885191
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/885191.html